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China Machine Press 





计算 机 算法 的 设计 与 分 析 


本 书 是 著名 计算 机 科学 家 Alfred V. Aho, John E. Hopcroft 和 Jeffrey D. UlIman 合 著 的 一 部 经 典 著 作 ， 着 重 介 
绍 计算 机 算法 设计 领域 的 统一 原则 和 基本 概念 。 书 中 深入 分 析 一 些 计算 机 模型 上 的 算法 ， 以 及 一 些 有 效 算法 常 
用 的 数据 结构 和 编程 技术 ， 为 读者 提供 了 有 关 递 归 方 法 、 分 治 方法 和 动态 规划 方面 的 详细 实例 和 实际 应 用 ， 并 
致力 于 更 有 效 算 法 的 设计 和 开发 。 同 时 ， 对 NP 完全 等 问题 能 否 有 效 求解 进行 分 析 ， 并 探索 应 用 启发 式 算法 解决 
问题 的 途径 。 另 外 ， 本 书 还 提供 了 大 量 富有 指导 意义 的 习题 。 

本 书 可 以 作为 高 等 院 校 计 算 机 专业 本 科 生 和 研究 生 算法 设计 课程 的 教材 ， 也 可 以 作为 计算 机 算法 理论 中 更 
高 级 课程 的 教材 。 





本 书 特点 : 

€ 介绍 若干 计算 模型 ,包括 图 灵机 模型 、 随 机 存 取 计算 机 模型 以 及 它们 的 变 体 在 算法 设计 和 分 析 中 的 作用 
e 介绍 设计 有 效 算法 相关 的 数据 结构 ， 给 出 递归 、 分 治 法 、 动 态 规划 技术 以 及 相关 的 算法 例子 ; 

e 解释 排序 算法 、 集 合算 法 、 图 算法 、 模 式 匹 配 算法 、 快 速 伟 里 叶 变 换 的 技术 细节 和 应 用 技巧 ; 

e 讨论 矩阵 乘法 、 多 项 式 运算 以 及 整数 算法 的 内 在 机 理 ; 

e 探讨 一 些 问题 的 时 间 复 杂 度 和 空间 复杂 度 ， 涉 及 NP 完 全 问题 以 及 一 些 可 以 证 明 不 存在 有 效 算法 的 问题 ， 

并 将 计算 难度 的 概念 和 向 量 空间 的 线性 独立 性 关联 在 一 起 ; ， 
e 本 书 算法 原 采用 ALGOL 实 现 ， 译 者 为 配合 国内 教学 实际 ， 在 附录 中 给 出 了 大 多 数 经 典 算法 的 C/C++ 实现 。 





M EN V. Aho "n 


者 . IEEE Fellow， 美 国 科学 与 艺术 学 院 及 国家 工程 学 院 院 
简 | 士 ， 曾 获得 IEEE 的 冯 “' 诺 伊 曼 奖 。 他 是 《编译 原理 》 (Compiler: Principles, Techniques, 
介 | and Tools) 的 第 一 作者 。 他 目前 的 研究 方向 为 量子 计算 、 程 式 设计 语言 、 编 译 器 和 算法 等 。 


博士 是 康 奈 尔 大 学 工程 学 院 院 长 兼 计算 机 科学 系 教 
John E. Hopcroft 2 ES, smuessaennmaece 
学 院 院 士 ，1986 年 因 其 在 数据 结构 、 算 法 设计 与 分 析 等 领域 的 重要 贡献 而 获得 图 灵 奖 。 他 还 是 
《自动 机 理论 、 语 言 和 计算 导论 》 (Introduction to Antomata Theory, Languages, and 
Computation) 的 第 一 作者 。 他 目前 的 研究 方向 是 信息 存 取 。 


博士 先后 任教 于 普林斯顿 大 学 和 斯 坦 福 大 学 ， 现 已 
Jeffrey D. Ullman a 他 是 美国 国家 工程 学 院 院士 ， 曾 获得 1996 
年 的 Sigmod 贡 献 奖 和 2000 年 的 Knuth 奖 等 诸多 学 术 奖 项 ， 除 本 书 外 ， 他 还 与 Aho 合 著 了 《编译 
原理 》， 与 Hopcroft 合 著 了 《自动 机 理论 、 语 言 和 计算 导论 》， 并 与 其 他 数据 库 专家 合 著 了 数 
据 库 方面 的 名 著 ， 如 《数据 库 系 统 基础 教程 》 (A First Course in Database Systems) 等 。 
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本 书 是 一 部 设计 与 分 析 领 域 的 经 典 著作 ， 着 重 介绍 了 计算 机 算法 设计 领域 的 基本 原则 和 根本 原理 。 书 
中 深入 分 析 了 一 些 计算 机 模型 上 的 算法 ， 介 绍 了 一 些 和 设计 有 效 算 法 有 关 的 数据 结构 和 编程 技术 ， 为 读者 
提供 了 有 关 递 归 方法 、 分 治 方法 和 动态 规划 方面 的 详细 实例 和 实际 应 用 ， 并 致力 于 更 有 效 算法 的 设计 和 开 
发 。 同 时 ， 对 NP 完全 等 问题 能 否 有 效 求 解 进行 了 分 析 ， 并 探索 了 应 用 启发 式 算法 解决 问题 的 途径 。 另 外 ， 
本 书 还 提供 了 大 量 富有 指导 意义 的 习题 。 

本 书 可 以 作为 高 等 院 校 计算 机 算法 设计 与 分 析 课程 的 本 科 生 或 研究 生 教材 ， 也 可 以 作为 计算 机 理论 研 
究 人 员 、 计 算 机 算法 设计 人 员 的 参考 书 。 
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出 版 者 的 话 


文艺 复兴 以 降 ， 源 远 流 长 的 科学 精神 和 逐步 形成 的 学 术 规 范 ， 使 西方 国家 在 自然 科学 的 各 

个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 传统 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 间 名 家 辈 

出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ， 美 国 的 产业 界 与 教育 界 越 来 越 紧密 地 结合 ， 计 算 机 学 科 中 的 

许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科学 著作 ， 不 仅 壁 划 了 研究 的 

范畴 ， 还 揭 如 了 学 术 的 源 变 ， 既 遵循 学 术 规范 ， 又 自 有 学 者 个 性 ， 其 价值 并 不 会 因 年 月 的 流逝 而 

Mug 减退 。 

N 近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我 国 的 计算 机 产业 发 展 迅猛 ， 对 专业 人 才 的 需求 日 益 迫 

切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 时 ， 也 是 挑战 ， 而 专业 教材 的 建设 在 教育 战略 上 显得 举 

惟一 起 轻重 。 在 我 国信 息 技术 发 展 时 间 较 短 、 从 业 人 员 较 少 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 机 科 

学 发 展 的 几 十 年 间 积 淀 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国外 优秀 计算 机 教 

材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 积极 的 推动 作用 ， 也 是 与 世界 接轨 、 建 设 真正 的 世界 一 流 
大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 图 文 信息 有 限 公司 较 早 意识 到 “出 版 要 为 教育 服务 ”"。 自 1998 年 开始 ， 
华章 公司 就 将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 几 年 的 不 懈 努 力 ， 我 们 与 Pren- 
tice Hall, Addison - Wesley, McGraw-Hill, Morgan Kaufmann 等 世界 著名 出 版 公司 建立 了 良好 的 合 
作 关 系 ， 从 它们 现 有 的 数 百 种 教材 中 王选 出 Tanenbaum，Stroustrup ，Kemighan Jim Gray 等 大 师 
名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 习 、 研 究 及 记 藏 。 大 理 石 纹 
理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 鼎力 襄 助 ， 国 内 的 专家 不 仅 提 供 了 中 肯 
的 选 题 指 导 ， 还 不 辞 劳苦 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 在 中 国 
的 传播 ， 有 的 还 专程 为 其 书 的 中 译本 作 序 。 迄 今 ,“ 计 算 机 科学 丛书 "已 经 出 版 了 近 百 个 品种 ， 
这 些 书 籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采用 为 正式 教材 和 参考 书籍 ， 为 进一步 推 
广 与 发 展 打下 了 坚实 的 基础 。 

随 着 学 科 建 设 的 初步 完善 和 教材 改革 的 逐渐 深化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 
都 步 人 一 个 新 的 阶段 。 为 此 ， 华 章 公司 将 加 大 引进 教材 的 力度 ， 除 “计算 机 科学 丛书 "之 外 ， 对 
影印 版 的 教材 ， 则 单独 开辟 出 “经 典 原 版 书库 ”。 为 了 保证 这 两 套 从 书 的 权威 性 ， 同 时 也 为 了 更 
好 地 为 学 校 和 老师 们 服务 ， 华 章 公司 聘 请 了 中 国 科学 院 、 北 京 大 学 、 清 华 大 学 、 国 防 科技 大 学 、 
复旦 大 学 、 上 海 交 通 大 学 、 南 京 大 学 、 浙 江 大 学 、 中 国 科技 大 学 、 哈 尔 滨 工业 大 学 、 西 安 交 通 大 
学 、 中 国人 民 大 学 、 北 京 航空 航天 大 学 、 北 京 邮电 大 学 、 中 出 大学、 解放 军 理工 大 学 、 郑 州 大 
学 、 湖 北 工学 院 、 中 国 国 家 信息 安全 测评 认证 中 心 等 国内 重点 大 学 和 科研 机 构 在 计算 机 的 各 个 
领域 的 著名 学 者 组 成 “专家 指导 委员 会 ” ， 为 我 们 提供 选 题 意见 和 出 版 监督 。 

这 两 套 从 书 是 响应 教育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 的 
教学 度 身 订 造 的 。 其 中 许多 教材 均 已 为 M. LT. ，Stanford，U. C. Berkeley, C. M. U. 等 世界 名 牌 
大 学 所 采用 。 不 仅 涵 盖 了 程序 设计 、 数 据 结构 、 操 作 系统 、 计 算 机 体系 结构 、 数 据 库 、 编 译 原 
理 、 软 件 工程 、 图 形 学 、 通 信和 与 网 络 、 离 散 数学 等 国内 大 学 计算 机 专业 普遍 开设 的 核心 课程 ， 而 
且 各 具 特 色 一 有 的 出 自 语言 设计 者 之 手 、 有 的 历经 三 十 年 而 不 衰 、 有 的 已 被 全 世界 的 几 百 所 高 
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校 采用 。 在 这 些 贺 熟 通 博 的 名 师 大 作 的 指引 之 下 ， 读 者 必 将 在 计算 机 科学 的 官 暴 中 由 登 堂 而 
AX. 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因 素 使 我 们 的 图 书 
有 了 质量 的 保证 ， 但 我 们 的 目标 是 尽善尽美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 


帮助 。 教 材 的 出 版 只 是 我 们 的 后 续 服务 的 起 点 。 华 章 公司 欢迎 老师 和 读者 对 我 们 的 工作 提出 建 


议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


电子 邮件 :hzjsj@ hzbook. com 

联系 电话 : (010)68995264 

联系 地 址 : 北京 市 西城 区 百 万 庄 南 街 1 号 
邮政 编码 : 100037 
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x 
z= 者 序 
本 书 是 算法 设计 与 分 析 领 域 的 经 典 之 作 。 
本 书 和 Knuth 所 著 的 《计算 机 程序 设计 艺术 》9 Cormen, Leiserson 和 Rivest 等 著 的 《算法 导 
论 》e 合 称 为 算法 设计 领域 的 3 大 名 著 。 和 《算法 导论 ) 力 求 浅 显 易 羽 及 颇具 全 面 性 相 比 ， 本 书 更 
倾向 于 数学 和 形式 化 描述 ， 特 别 对 图 灵机 模型 和 空间 复杂 度 等 有 更 深入 的 讨论 。 本 书 的 另 一 个 
特点 是 简洁 ， 直 指 问题 核心 ， 并 给 出 严谨 的 分 析 及 解决 方案 和 改进 措施 。 
不 管 从 内 容 上 还 是 形式 上 ， 目 前 市 场 上 所 有 算法 设计 的 书籍 都 深 受 本 书 的 影响 (截至 本 书 中 


文 版 出 版 之 前 ， 据 Amazon Kit, 已 有 271 本 书籍 引用 了 本 书 ) ， 可 以 说 ， 不 论 是 计算 机 理论 研究 
人 员 、 计 算 机 算法 设计 者 还 是 研究 生 、 本 科 生 ， 都 可 以 通过 阅读 本 书 受 到 启发 。 


本 书 的 特点 
。 介绍 了 若干 计算 模型 ， 包 括 图 灵机 模型 、 随 机 存 取 计 算 机 模型 以 及 它们 的 变 体 在 算法 设 


计 和 分 析 中 的 作用 。 

。 介绍 了 和 设计 有 效 算法 相关 的 数据 结构 ， 给 出 递归 、 分 治 法 、 动 态 规划 技术 以 及 相关 的 
算法 例子 。 

。 解释 了 排序 算法 、 集 合算 法 、 图 算法 、 模 式 匹 配 算法 、 快 速 傅 蜂 叶 变 换 的 技术 细节 和 应 
用 技巧 。 


* 讨论 了 和 矩阵 守法、 多 项 式 运算 以 及 整数 算法 的 内 在 机 理 。 
。 探讨 了 一 些 问 题 的 时 间 复 杂 度 和 空间 复杂 度 ， 涉 及 NP 完全 问题 以 及 一 些 可 以 证 明 是 不 存 
在 有 效 算法 的 问题 ， 并 将 计算 难度 的 概念 和 向 量 空间 的 线性 独立 性 关联 在 一 起 。 


关于 本 书 附录 


-本 书 使 用 一 种 称 为 dgin ALGOL 的 语言 来 描述 算法 ，Pidgin 意思 是 “由 两 种 或 多 种 语言 混合 
而 成 的 一 种 简化 的 说 话 方式 ， 语 法 和 词汇 较 初 等 ， 用 于 不 同 语言 者 进行 交流 ”。 算 法 的 开发 可 分 
为 设计 、 分 析 和 实现 3 个 环节 。 该 过 程 可 能 不 断 重 复 ， 直 到 需求 满足 为 止 。 一 般 说 来 ， 算 法 的 描 
述 只 要 清晰 明了 就 可 以 了 。 书 中 所 用 的 Pidgin ALGOL 语言 ， 对 于 算法 的 描述 是 充分 的 。 但 AL 
GOL 是 一 个 比较 古老 的 语言 ， 如 果 读 者 想 测试 书 中 给 出 的 例子 ， 那 么 找到 一 个 ALGOL 语言 的 编 
译 器 可 是 一 件 不 容易 的 事 ( 译 者 推荐 使 用 PLT Scheme 附带 的 ALGOL 语言 解释 器 ， 读 者 可 参阅 本 
书 译 者 的 另 一 本 译作 《程序 设计 方法 》， 人 民 邮 电 出 版 社 2003 年 出 版 ) 。 因 此 ， 在 翻译 本 书 的 时 
候 ， 经 和 机 械 工 业 出 版 社 讨论 协商 ， 本 书 的 代码 保持 原貌 ， 另 将 书 中 的 算法 用 CLC++ 实现 并 作 
为 译本 的 附录 。 本 书 附录 中 的 代码 由 译 者 的 研究 生 王 问 芳 实现 ， 并 经 杨 欢 、 彭 冲 、 许 赵云 等 同学 
测试 ， 以 保证 其 准确 性 。 

本 韦 的 翻译 工作 由 黄 林 册 负责 并 与 其 博士 生 共同 完成 。 其 中 第 9 章 和 第 10 章 由 王 德 俊 翻 译 ， 
第 7 章 和 第 8 章 由 张 什 翻 译 ， 参 加 翻译 的 还 有 王 欣 、 徐 小 辉 、 伍 建 烛 等 ， 全 书 由 黄 林 胶 统 稿 和 


O KRWI 卷 第 1 册 和 第 4 卷 第 2、3 和 4 册 的 双语 版 已 由 机 械 工业 出 版 社 出 版 。 一 一 编辑 注 
O ”该 书 的 第 2 版 已 由 机 械 工业 出 版 社 翻 译 出 版 。 一 一 编辑 注 
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审 校 。 

本 书 的 英文 版 ， 曾 学 习 过 两 次 。 一 次 是 1980 年 ， 当 时 我 在 浙江 大 学 读 计算 机 本 科 ， 另 一 次 
是 1986 年 ， 那 时 我 已 经 在 上 海 交 通 大 学 攻读 看 士 学 位 了 。 这 本 教材 给 我 的 印象 很 深 ， 但 没有 想 
到 在 20 多 年 后 我 有 机 会 翻译 这 本 书 ， 感 谢 机 械 工 业 出 版 社 华章 分 社 给 我 重 温 巨著 并 用 中 文 表述 
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算法 研究 是 计算 机 科学 的 核心 。 近 年 来 ， 算 法 领域 取得 了 很 多 重要 的 进展 。 这 些 进 展 包括 快 
速算 法 的 开发 ， 如 发 明了 傅 里 叶 变换 快速 算法 ， 以 及 不 存在 有 效 算法 的 本 质问 题 的 惊人 发 现 。 这 
些 结果 点 燃 了 计算 机 学 者 对 算法 研究 的 兴趣 。 算 法 设计 与 分 析 已 成 为 一 个 受到 广泛 注意 的 领域 。 
本 书 旨 在 将 这 个 领域 的 一 些 基本 成 果 汇 集 在 一 起 ， 使 算法 设计 的 基本 原则 和 根本 原理 的 教学 变 
得 容易 。 


本 书 内 容 


分 析 一 个 算法 的 性 能 需要 一 种 计算 机 模型 。 本 书 首先 介绍 一 些 形式 模型 ， 使 用 它们 不 仪 可 
以 进行 算法 分 析 ，、 还 能 确切 反映 实际 计算 机 的 一 些 显 著 特 性 。 这 些 模型 包括 随机 存 取 计算 机 
RAM、 随 机 存 取 存储 程序 计算 机 RASP 以 及 一 些 变 体 。 为 了 证 明 第 10、11 章 中 的 一 些 算法 的 复 
杂 度 下 界 是 指数 的 ， 本 书 还 将 讨论 图 灵机 模型 。 由 于 程序 设计 趋向 于 远离 机 器 语言 ， 因 此 本 书 将 
引入 一 种 称 为 简化 ALGOL 语言 的 高 级 程序 语言 作为 描述 算法 的 主要 工具 。 简 化 ALGOL 语言 程序 
的 复杂 度 和 机 器 模型 是 相关 的 。 

第 2 章 介绍 在 设计 有 效 的 算法 中 使 用 的 基本 数据 结构 和 程序 设计 技术 。 涉 及 列表 、 下 推 式 存 
储 结 构 、 队 列 、 树 和 图 等 。 同 时 给 出 递归 、 分 治 法 、 动 态 规划 的 详细 解释 以 及 一 些 应 用 实例 。 

第 3 ~9 章 给 出 一 些 不 同 的 应 用 第 2 章 所 介绍 的 基本 技术 的 领域 。 这 些 章节 致力 于 设计 已 知 
最 有 效 的 渐 近 算法 。 由 于 要 考虑 渐 近 性 ， 一 些 算法 可 能 仅 对 那些 输入 规模 比 目 前 实际 所 遇 到 的 
问题 更 大 时 才 有 效 。 特 别 是 第 6 章 中 的 一 些 矩 阵 乘 法 算法 、 第 7 章 中 的 Schonhage -~ Strassen 整数 
乘法 算法 以 及 第 8 章 中 的 一 些 多 项 式 和 整数 算法 。 

另 一 方面 , 第 3 章 中 的 大 多 数 排序 算法 、 第 4 章 中 的 搜索 算法 、 第 5 章 的 图 算法 、 第 7 章 的 
快速 傅 里 叶 算法 以 及 第 9 章 中 的 串 匹 配 算法 都 是 广泛 应 用 的 算法 。 这 些 算法 对 许多 实际 应 用 问题 
的 输入 规模 来 说 都 是 有 效 的 。 

第 10 ~ 12 章 讨论 计算 复杂 度 的 下 界 。 不 管 对 于 程序 设计 者 还 是 希望 了 解 计算 本 质 的 人 都 会 
对 了 解 一 个 问题 固有 的 计算 难度 感 兴趣 。 第 10 章 讨论 一 类 重要 的 问题 ， 即 NP 完全 问题 。 该 类 
中 所 有 问题 对 于 计算 难度 来 说 是 等 价 的 ， 即 ， 若 该 类 中 有 一 个 问题 存在 有 效 的 算法 (多 项 式 时 间 
界 ) ， 则 该 类 中 的 所 有 问题 都 有 有 效 的 算法 。 由 于 该 问题 类 包含 了 许多 在 现实 中 非常 重要 且 被 广 
泛 研 究 的 问题 ， 如 整数 规划 问题 和 旅行 商 问题 ， 有 理由 怀疑 此 类 问题 不 存在 有 效 的 算法 。 因 此 ， 
如 果 一 个 程序 设计 者 了 解 到 他 欲 寻 找 有 效 算法 的 问题 属于 此 类 ， 他 就 应 该 尝试 寻找 启发 式 的 方 
法 。 尽 管 有 丰富 的 经 验证 据 ，NP 完全 问题 是 否 存 在 有 效 的 算法 还 是 一 个 有 待 解决 的 问题 。 

第 11 章 定义 了 一 些 确实 可 以 证 明 不 存在 有 效 算法 的 问题 。 第 10 章 和 第 11 章 的 内 容 依赖 于 
本 书 1.6 和 1.7 节 引 入 的 图 灵机 的 概念 。 

最 后 一 章 将 计算 难度 的 概念 和 向 量 空间 的 线性 独立 性 关联 在 一 起 。 该 章 给 出 了 证 明 较 第 10 
章 和 第 11 章 简 单 很 多 的 一 些 问题 的 复杂 度 下 界 的 方法 。 


如 何 使 用 本 书 
本 书 旨 在 作为 涉及 算法 设计 与 分 析 课 程 的 人 门 教材 。 强 调 算法 的 思想 以 及 如 何方 便 地 理解 
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算法 而 不 是 算法 实现 的 技巧 和 细节 。 因 此 ， 常 使 用 内 容 直 观 的 解释 而 不 是 元 长 的 证 明 。 本 书 是 自 
包含 的 ， 读 者 无 需 具 有 数学 和 程序 设计 语言 的 专业 背景 。 然 而 ， 还 是 希望 读者 具备 一 定 的 处 理 数 
学 概念 的 能 力 ， 热 悉 某 种 高 级 程序 设计 语言 如 FORTRAN R ALGOL 等 。 要 完全 理解 第 6、7、8 
和 12 章 等 内 容 ， 读 者 还 需要 具备 线性 代数 的 知识 。 

本 书 曾 用 于 算法 设计 的 本 科 生 和 研究 生 课 程 。 一 个 学 期 的 课程 一 般 涉及 第 1 ~5 章 以 及 第 9 
和 10 章 的 大 部 分 内 容 ， 其 他 章节 则 可 浅 尝 驾 止 。 在 算法 的 介绍 性 课程 中 ， 可 以 第 1 ~5 RAE 
点 ， 而 1.6、1.7、4. 13、5. 11 节 和 定理 4.5 一 般 可 不 涉及 。 本 书 也 可 用 于 强调 算法 理论 的 高 级 
课程 ,第 6 ~12 章 的 内 容 可 作为 此 类 课程 的 基础 资料 。 

每 章 最 后 都 提供 有 大 量 的 习题 ， 教 师 可 选用 作为 学 生 的 作业 。 习 题 按 难 度 进行 分 类 。 没 有 星 


号 的 可 用 于 介绍 性 的 课程 ， 有 一 个 星 号 ( * ) 的 可 用 于 高 级 课程 ， 有 两 个 星 号 的 可 用 于 研究 生 高 


级 课程 。 每 章 后 面 的 参考 文献 和 注释 提供 了 正文 以 及 习题 包含 的 相应 算法 和 结果 的 公共 资源 。 
致谢 
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819 计算 模型 


给 定 一 个 问题 ， 如 何 寻 求 一 个 有 效 的 求解 算法 ? 如 果 得 到 了 一 个 算法 又 该 如 何 与 解决 同一 
问题 的 其 他 算法 进行 比较 ? 如何 判断 一 个 算法 的 好 坏 ? 程序 设计 者 和 理论 计算 机 学 者 常 对 此 类 
问题 的 本 质感 兴趣 。 本 书 将 从 不 同 的 方面 探讨 这 些 问 题 。 

本 章 将 讨论 几 个 典型 的 计算 机 模型 ， 包 括 随 机 存 取 计 算 机 RAM、 随 机 存 取 存 储 程序 计算 机 
RASP 和 图 灵机 TM 等 。 比 较 这 些 模型 的 能 力 和 算法 复杂 度 的 关系 ， 从 其 导出 若干 更 成 熟 的 计算 
模型 ， 如 直线 状 程序 模型 、 位 计算 模型 、 位 向 量 计算 模型 和 决策 树 模型 等 。 本 章 的 最 后 一 节 介绍 
一 种 描述 算法 的 “简化 ALGOL 语言 ”。 


1. 1 算法 和 复杂 度 


评价 算法 有 多 个 标准 。 最 通常 的 是 考虑 其 求解 越 来 越 大 的 问题 实例 所 需 的 时 间或 空间 开销 
的 增长 率 。 一 般 将 一 个 称 为 问题 规模 的 整数 和 算法 相关 联 ， 该 整数 通常 是 问题 的 输入 数据 的 规 
模 。 例 如 ， 对 于 矩阵 乘法 ， 其 规模 可 能 是 相 乘 的 矩阵 的 最 大 维 数 ， 而 图 问题 的 规模 可 能 是 边 的 
数目 。 

算法 所 需要 的 时 间 是 问题 规模 的 函数 ， 称 为 算法 的 时 间 复 杂 度 。 当 问题 规模 增加 时 ， 复 杂 
度 的 极限 行为 称 为 算法 的 浙 近 时 间 复杂 度 。 类 似 的 定义 也 适用 于 空间 复杂 度 和 渐 近 空间 复杂 度 。 

算法 的 渐 近 复杂 度 确定 了 可 用 该 算法 解决 的 问题 的 规模 。 对 于 某 个 常数 "<， 如 果 一 个 算法 能 
在 cn’ 时 间 内 处 理 输入 规模 为 ”的 问题 ， 则 称 该 算法 的 时 间 复 杂 度 为 0( 到 ) ， 读 为 “ 阶 为 至 "。 更 
精确 地 ， 如 果 存 在 常数 z:， 除 了 有 限 的 若干 个 值 (可 能 为 空 ) 外 ,对 所 有 非 负 的 n 都 有 'g(n) < 
df(n)， 则 称 函数 g(n) 是 OC(n)) 的 。 

也 许 有 人 认为 ， 现 代数 字 计 算 机 的 出 现 带 来 的 计算 机 速度 的 大 幅度 提高 会 前 弱 对 有 效 算法 
的 需求 。 然 而 ， 结 果 恰 恰 相 反 。 计 算 速度 的 提高 使 我 们 可 以 处 理 更 大 的 问题 ， 但 算法 复杂 度 决定 
了 由 于 计算 速度 的 提高 带 来 的 可 处 理 的 问题 规模 的 增 量 的 大 小 。 

假定 有 时 间 复 杂 度 如 下 的 5 个 算法 A, ~A: 


算法 时 间 复 杂 度 
A n 

A, nlogn? 

A, n. 

A, n 

A, 2 


这 里 的 时 间 复 杂 度 是 处 理 一 个 输入 规模 为 n 的 问题 的 时 间 单 元 数 。 假 定 一 个 时 间 单 元 等 于 1 
毫秒 ， 算 法 A, 能 在 一 秒 时 间 内 处 理 输入 规模 为 1000 的 问题 ， 而 算法 A. 可 在 一 秒 内 处 理 输 
入 规模 至 多 为 9 的 问题 。 图 1-1 分 别 给 出 了 1 秒 、1 分 和 1 个 小 时 内 这 5 个 算法 可 以 处 理 的 
问题 规模 。 


日 ”除非 特别 说 明 ， 本 书 所 有 对 数 都 是 以 2 为 底 。 








最 大 问题 规模 





12 十 倍加 速 的 效果 


假定 下 一 代 计算 机 的 速度 是 目前 的 10 倍 。 图 1-2 是 计算 速度 增加 后 在 相同 的 时 间 内 可 以 解 
决 的 问题 规模 的 增 量 。 注 意 对 于 算法 As, 10 倍 的 加 速 得 到 的 结果 是 可 以 解决 的 问题 规模 比 原来 
的 规模 仅 大 3 左右 ， 而 对 于 算法 A, 则 是 原来 的 3 fi. 

撤 开 速度 的 增加 ， 现 在 考虑 使 用 效率 更 高 的 算法 的 效果 。 回 到 图 1-1， 使 用 1 分 钟 为 比较 基 
础 ， 用 算法 A, 代替 算法 4 ， 此 时 可 以 解决 规模 为 原来 6 倍 的 问题 ， 用 算法 A, 代替 算法 4,， 则 可 
以 解决 规模 为 原来 125 倍 的 问题 。 这 些 结果 比 用 速度 快 10 倍 的 计算 机 却 得 到 2 倍 的 改进 更 使 人 
印象 深刻 。 如 果 以 工 个 小 时 作为 比较 基础 ， 差 异 将 更 加 明显 。 由 此 可 以 得 到 结论 ， 一 个 算法 的 渐 
近 时 间 复 杂 度 是 衡量 算法 好 坏 的 一 个 重要 标准 ， 随 着 未 来 计算 速度 的 提高 ， 它 必 将 变 得 更 加 
重要 。 

除了 注重 阶 量 级 外 ， 也 要 认识 到 有 时 一 个 增长 率 较 快 的 算法 的 比例 常数 可 能 比 一 一 个 增长 率 
较 低 的 算法 小 。 在 这 种 情况 下 ， 对 于 小 的 问题 ， 甚 至 是 使 我 们 感 兴趣 的 同一 规模 下 的 所 有 问题 ， 
增长 率 较 快 的 算法 可 能 会 比 增长 率 低 的 算法 优越 。 例 如 ， 假 定 算法 A. A A, A, AA, 的 时 间 
复杂 度 分 别 是 1000n，100n log n, 107°, n' 和 2"， 则 对 于 问题 规模 为 2 二 n<9，4, 将 是 最 好 的 算 
法 ; 对 于 10«n«58, A, 将 是 最 好 的 算法 ; 对 于 59 «104, A, 将 是 最 好 的 算法 ;而 对 于 大 于 
1024 的 规模 ，4, 才 是 最 好 的 算法 。 

在 进一步 讨论 算法 和 复杂 度 之 前 ， 必 须 定 义 执行 算法 的 计算 设备 模型 ， 并 指出 计算 中 的 基 
本 步 的 含义 。 遗 盎 的 是 ， 并 没有 一 个 对 所 有 情况 都 适用 的 模型 。 主 要 的 困难 在 于 如 何 对 计算 机 字 
的 大 小 进行 定义 。 例 如 ， 如 果 假 定 一 个 计算 机 字 可 以 存储 任意 大 小 的 整数 ， 则 通过 编码 ， 整 个 问 
题 就 可 以 存放 于 一 个 计算 机 字 中 的 一 个 整数 。 另 一 方面 ， 如 果 假定 一 个 计算 机 字 的 长 度 是 有 限 


的 ， 则 必须 考虑 如 何 存 储 任意 大 小 的 整数 ， 以 及 通常 在 处 理 规模 适当 的 问题 时 可 以 避免 的 其 他 Á 


困难 。 对 于 每 个 问题 ， 都 必须 选择 一 个 合适 的 模型 来 反映 给 定 的 算法 在 真正 的 计算 机 上 运行 时 
所 耗费 的 时 间 。 

接 下 来 的 几 节 讨论 计算 设备 的 一 些 基 本 模型 ， 比 较 重要 的 模型 是 随机 存 取 计算 机 、 随 机 存 
取 程序 计算 机 和 图 灵机 。 在 计算 能 力 上 它们 是 等 价 的 ， 但 在 速度 上 不 一 样 。 
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研究 形式 计算 模型 的 最 主要 动机 是 揭示 不 同 问题 的 固有 计算 难度 。 本 章 将 证 明 一 些 问 
题 的 计算 时 间 的 下 界 。 为 了 说 明 对 于 给 定 的 问题 不 存在 一 个 算法 能 在 某 一 时 间 内 解决 它 ， 
需要 一 个 精确 的 、 芝 常 是 高 度 程式 化 的 等 法 定义 。 图 灵 机 (参见 1 6 节 ) 就 是 定义 算法 的 一 
个 好 的 工具 。 

在 描述 算法 和 交流 算法 时 ， 还 需要 一 个 比 随机 存 取 计算 机 、 随 机 存 了 到 存储 程 序 计算 机 或 图 
灵机 更 加 自然 并 易于 理解 的 算法 描述 记 法 。 由 此 ， 本 书 引进 了 称 为 Pidgin( Pidgin 的 含义 是 由 两 
种 或 多 种 语言 混合 而 成 的 一 种 简化 的 语言 。 一 一 译 者 注 ) ALGOL 的 高 级 语言 ， 即 简化 ALGOL 语 
言 。 本 书 将 使 用 该 语言 进行 算法 描述 。 然 而 ,为 了 解 使 用 简化 ALCOL 语言 描述 的 算法 的 复杂 度 ， 
还 必须 将 简化 ALGOL 语言 和 更 加 形式 化 的 计算 模型 相关 联 。 本 章 最 后 一 节 讨论 该 问题 。 


1.2 随机 存 取 计 算 机 


随机 存 取 计算 机 (RAM) 模 拟 一 台 带 有 一 个 累加 器 的 计算 机 ， 该 计算 机 的 程序 指令 不 允许 对 
程序 自身 进行 修改 。 

一 台 RAM 计算 机 包括 只 读 输入 带 、 只 写 输出 带 、 一 个 程序 和 一 个 存储 器 ( 见 图 1-3)。 输 入 
带 是 一 个 方 格 序列 ， 每 个 方 格 可 存放 一 个 整数 (可 以 是 负 整 数 ) 。 每 从 输入 带 读 取 一 个 整数 ， 带 
首 就 往 右 移动 一 个 方 格 。 只 写 操作 的 输出 带 的 初始 状态 全 部 为 空 。 每 执行 一 次 写 指令 ， 就 在 当前 


输出 带 首 的 方 格 中 写 人 一 个 整数 ， 并 将 带 首 往 右 移动 一 个 方 格 。 不 允许 对 输出 带 上 写 和 人 的 符号 
进行 修改 。 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 





图 1-3 一 台 RAM 计算 机 

存储 器 包含 了 寄存 器 r。，r, ，… ，r,，…， 每 个 都 可 存储 任意 大 小 的 整数 ， 可 用 寄存 器 的 数 
目 没有 限制 。 该 抽象 形式 适用 于 下 述 情景 —— 

1. 问题 的 规模 足够 小 ， 可 以 存放 在 计算 机 的 主 存储 器 内 ; - 

2. 计算 中 用 到 的 整数 足够 小 ， 可 以 用 一 个 计算 机 字 表 示 。 

在 RAM 模型 中 ， 程 序 并 不 存放 在 存储 器 中 ， 因 此 程序 不 能 修改 自身 。 程 序 只 是 (可 选 ) 带 标 
号 的 指令 序列 ， 同 实际 计算 机 上 使 用 的 指令 类 似 ， 但 其 确切 特性 并 不 重要 ， 通 常 可 假定 有 算术 运 
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算 指令 、 输 入 输出 指令 、 间 接 寻 址 (例如 数组 的 下 标 ) 和 转移 指令 等 。 所 有 的 运算 都 在 称 为 累加 
器 的 寄存 器 ro 中 进行 ， 累 加 器 和 其 他 的 寄存 器 一 样 可 以 存储 任意 的 整数 。 一 个 RAM 指令 集 范例 


如 图 14 所 示 。 每 条 指令 包含 两 个 部 分 ， 操 作 码 和 地 址 。 

原则 上 说 ， 可 以 将 图 1-4 中 的 指令 集 扩充 为 任何 实际 计算 机 
的 指令 集 ， 如 添加 逻辑 或 字符 操作 指令 ， 而 不 改变 解决 问题 的 复 
杂 度 的 阶 量 级 。 读 者 可 以 按照 需要 设想 合适 的 指令 集 。 

操作 数 可 以 是 如 下 之 一 : 

1. =i 表示 整数 i 本身; 

2. 非 负 整数 i 表示 寄存 器 i WAR; 

3.，*i 表 示 间 接 寻 址 。 即 操作 数 是 寄存 器 j 的 内 容 ,j 是 寄存 

ae i 中 存放 的 整数 。 如 果 7 <0， 则 停机 。 

对 于 使 用 汇编 语言 编程 的 程序 员 来 说 ,这 些 指 令 是 再 熟 
悉 不 过 的 了 。 定 义 程序 P 的 含义 ,借助 两 个 量 ,一 个 是 从 
非 负 整 数 到 整数 的 映射 <， 另 一 个 是 “位 置 计数 器 ”， 其 确定 





12. HALT 


图 1-4 RAM 指令 表 


下 一 条 要 执行 的 指令 。 函 数 c 是 内 存 映 射 ， c(i) 是 存储 在 寄存 器 i 中 的 整数 ( 即 寄存 器 ;i 


HAS). 


初始 时 ， 对 所 有 (20, c(i) =0, 位 置 计数 器 指向 P 中 第 一 条 指令 ， 输 出 带 全 部 为 空白 。 在 
执行 己 的 第 大 条 指令 之 后 ， 位 置 计 数 器 的 值 自动 设 为 上 +1( 即 下 一 条 指令 ) ， 除 非 第 上 条 指令 是 


JUMP, HALT, JGTZ 或 JZERO, 
为 了 说 明 指 令 的 含义 ， 可 定义 操作 数 a 的 值 v(a) 如 下 
v( zi) =i 
v(i) -c(i) 
v( * i) zc(c(i)) 


图 1- 中 的 表 定 义 了 图 14 中 每 条 指令 的 含义 。 没 有 定义 的 指令 ， 如 STORE =i， 可 以 认为 和 


HALT 一 样 。 类 似 地 ， 除 以 0 也 将 使 机 器 停机 。 


1 LOAD a c(0) < v(a) 
2. STORE i c(i) — c(0) 
STORE *i c(c(i)) — c(0) 

3. ADD a c(0) — c(0) + v(a) 

4. SUBa c(0) —¢(0) — v(a) 

5. MULT a c(0) ~ c(0) X v(a) 

6. DIV a c(0) — Ic(0)/v(a)] a 
7. READ i c(i) 二 当前 输入 符号 


READ «i eleli) je 当前 输入 符号 。 这 两 种 情况 下 , 输入 带 首都 右 移 一 个 方 格 
8. WRITE a 在 输出 带 首 的 当前 输出 带 方 格 打 印 v(a)。 然 后 带 首 右 移 一 个 方 格 


9. JUMP b 将 位 置 计数 器 设置 为 标号 为 5 的 指令 


10. JGTZ b 如 果 c (0)>0， 则 将 位 置 计数 器 设置 为 标号 为 5 的 指令 ， 


否则 ， 将 位 置 计数 器 的 值 设置 为 下 一 条 指令 


11. JZERO b MR c(0-—0, WHURTMBREARS A bild: 


否则 ， 将 位 置 计数 器 设置 为 下 一 条 指令 
12. HALT 执行 停止 





(D 在 本 书 中 , fx] G 的 上 取 整 ) 表示 大 于 或 等 于 x 的 最 小 整数 , Ld Oc 的 下 取 整 ) 


表示 小 于 或 等 于 x 的 最 大 整数 。 


图 1-5 RAM 指令 的 含义 。 操 作 数 a 是 =i、i 或 *i 


ROY 
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在 执行 头 8 条 指令 的 每 一 条 时 ， 位 置 计 数 器 增 1。 因 此 ， 除 非 遇 到 JUMP R HALT 指令 ,或 
者 当 累 加 器 的 内 容 大 于 0 MAB JGTZ 指令 ， 或 者 当 累加 器 的 内 容 等 于 0 时 过 到 JZERO 指令 ， 否 
则 程序 中 的 指令 将 按照 顺序 依次 执行 。 

一 般 来 说 ，RAM 程序 定义 了 一 个 从 输入 带 到 输出 带 的 映射 。 因 为 程序 并 不 是 对 所 有 的 输入 
带 都 会 停机 ， 因 此 映射 是 一 个 部 分 映射 ( 即 ， 对 一 些 输入 映射 可 能 没有 定义 ) 。 映 射 可 以 使 用 不 
同 的 方式 解释 ， 其 中 两 种 重要 的 解释 是 把 映射 看 作 一 个 函数 或 一 种 语言 。 

假定 程序 P 总 是 从 输入 带 读 取 n 个 整数 并 最 多 在 输出 带 上 写 进 一 个 整数 。 如 果 Lom. 
x 是 输入 带 前 n 个 方 格 中 的 整数 ， 程 序 P 的 执行 结果 是 将 写 人 输出 带 的 第 一 个 方 格 并 停机 ， 则 
称 程序 P 计 算 了 函数 /(x,，x,，…，x,) =y。 容易 看 出 ，RAM 模型 和 其 他 合理 的 计算 机 模型 一 
样 ， 可 以 计算 部 分 递归 函数 。 即 ， 给 定 任意 的 部 分 递归 函数 /， 可 以 定义 一 个 计算 注 的 RAM RE 
序 ， 给 定 一 个 RAM 程序 ， 可 以 定义 一 个 等 价 的 部 分 递归 函数 。( 参 阅 Davis[ 1958] 或 Rogers 
[1967 对 递归 函数 的 讨论 。) 

另外 一 种 解释 是 将 RAM 程序 作为 一 个 语言 的 接收 器 。 字 母 表 是 有 限 个 符号 的 集合 ， 语 言 是 
该 字母 表 上 字符 串 的 一 个 集合 。 字 母 表 的 符号 可 以 对 于 某 个 上 表示 为 整数 1，2，.…,，k。RAM 
可 按 以 下 方式 接受 一 种 语言 。 将 输入 串 。 = aia,…a, 放 置 到 输入 带 ， 其 中 符号 a 位 于 第 一 个 方 格 、 
符号 4, 位 于 第 2 个 方 格 ， 以 此 类 推 。 另外， 将 作为 终止 符号 的 0 放置 于 第 n+1 个 方 格 ， 作 为 输 
入 符号 串 的 结束 。 

如 果 己 读 人 所 有 * 中 的 符号 以 及 结束 符 ， 则 输入 串 ， 
被 RAM 程序 接受 , 将 1 写 人 输出 带 的 第 1 个 方 格 并 停 [begin 
机 。 尸 接受 的 语言 是 所 有 被 已 接受 的 输入 符号 串 的 集合 。 read rl; 


if r1 = 0 then write 0 
对 不 被 PP 接受 的 输入 字符 串 ， 程序 P 将 输出 非 1 的 符号 并 else 





停机 ， 也 可 能 不 停机 。 容 易 证 明 ， 一 种 语言 能 被 RAM E Oe en: 
序 接受 ， 当 且 仅 当 其 是 递归 可 枚 举 的 语言 。 一 种 语言 能 被 nern-t 
对 所 有 输入 都 可 停机 的 RAM 接受 ， 当 且 仅 当 其 是 递归 语 while 73 > 0 do 
言 (参见 Hoporoft 和 Ullman [ 1969] 对 递归 语言 和 递归 可 枚 | 
举 语言 的 讨论 ) 。 rr 

考虑 下 面 两 个 RAM 程序 示例 。 前 者 定义 一 个 函数 ， eT 
后 者 接受 一 种 语言 。 end 

例 1.1 考虑 如 下 给 定 的 函数 /(n) 

fn) -人 Ro n> L6 计算 mw 的 简化 ALGOL 程序 


图 1-6 所 示 是 一 个 简化 ALCOL 语言 的 程序 ?S， 通 过 将 n ERE n - 1 次 来 计算 /(n)。 相 应 的 
RAM 程序 见 图 1-7。 其 中 变量 r1, 7278003 分 别 存放 在 寄存 器 1、2 和 3 之 中 。 由 于 没有 进行 程序 
优化 ， 图 16 和 图 1-7 的 对 应 比较 明显 。 口 

例 1.2 考虑 一 个 RAM 程序 ， 它 接受 输入 字母 表 {1，21 上 的 语言 ， 该 语言 包含 1 和 2 的 数 
目 相等 的 任何 字符 串 。 程 序 将 每 个 输入 符号 读 人 寄存 器 1， 而 寄存 器 2 则 保留 了 目前 所 看 到 的 1 
和 2 的 数目 的 差异 数 d。 当 读 人 终止 符 0 时 ， 程 序 检查 差异 数 是 否 为 0， 如 是 ， 则 打印 1 并 停机 。 
假定 0、1 和 2 是 仅 有 的 可 能 输入 符号 。 

1-8 中 的 程序 包含 了 基本 的 算法 细节 。 等 价 的 RAM 程序 如 图 1-9 所 示 ， 其 中 寄存 器 1 存放 
xx， 而 寄存 器 2 存放 do 口 


O 参见 1.8 节 对 于 简化 ALCOL 语言 的 描述 。 
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RAM 程序 相应 的 简化 ALGOL 语句 
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write 72 


图 1-7 iP si RAM 程序 


begin 
d —0; 
read x; 
while x + 0 do 
begin 
if x = 1 then d —d-—1eled —d-^l; 





d«-0 
read x 
while x »* 0 do 


ifx#1 


then de d-i 


if d = 0 then write 1 
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1.8 RAM 程序 的 计算 复杂 度 


衡量 算法 的 两 个 重要 标准 是 时 间 和 空间 复杂 度 ， 它 们 都 是 输入 规模 的 函数 。 如 果 对 于 给 定 
的 输入 规模 ， 复 杂 度 考虑 的 是 对 所 有 给 定 规模 的 输入 ， 取 其 中 最 大 者 ， 则 该 复杂 度 称 为 最 坏 情况 
复杂 度 ; 而 车 复杂 度 考 虑 的 是 对 所 有 给 定 规模 的 输入 ， 取 “平均 " 值 ， 则 该 复杂 度 称 为 期 望 复杂 
度 。 算 法 的 期 望 复杂 度 通 常 比 最 坏 情 况 复杂 度 更 难以 确定 ， 这 是 因为 前 者 通常 必须 假定 输入 的 
分 布 情况 ， 而 现实 的 输入 分 布 在 数学 上 并 不 容易 处 理 。 因 此 ， 本 书 将 注重 最 坏 情况 复杂 度 ， 它 既 
容易 处 理 也 在 实际 中 有 着 广泛 的 应 用 。 然 而 ， 必 须 记 住 的 是 算法 在 最 坏 情况 复杂 度 最 好 的 算法 
并 不 必然 是 期 望 时 间 复 杂 度 最 好 的 算法 。 

一 个 RAM 程序 的 最 坏 情 况 时 间 复 杂 度 (或 简称 时 间 复 杂 度 ) 是 函数 败 n) ， 表 示 对 规模 为 上 的 
所 有 输入 ， 所 有 被 执行 的 指令 的 “时 间 ” 之 和 的 最 大 值 。 期 望 时 间 复 杂 度 则 是 对 规模 为 n 的 所 有 
输入 ， 所 有 被 执行 的 指令 的 “时 间 ” 之 和 的 平均 值 。 若 将 “执行 指令 花费 的 时 间 ” 换 为 “寄存 器 占用 
的 空间 ”， 就 得 到 了 空间 复杂 度 。 

精确 定义 时 间 和 空间 复杂 度 还 必须 规定 执行 每 条 RAM 指令 所 花费 的 时 间 和 每 个 寄存 器 使 用 
的 空间 。 对 RAM 程序 ， 这 里 将 考虑 两 种 代价 标准 。 在 统一 代价 标准 中 ， 每 条 RAM 指令 的 执行 花 
费 一 个 单位 的 时 间 ， 而 每 个 寄存 器 占用 一 个 单位 的 空间 。 本 书 如 果 没 有 特别 指出 ，RAM 程序 的 
复杂 度 就 按 统一 代价 标准 进行 度量 。 

有 时 另 一 衡量 标准 更 现实 , 它 考虑 到 实际 存储 器 字 的 有 限 大 小 ， 称 为 对 数 代 价 标准 。 令 
Li) 是 如 下 定义 在 整数 上 的 对 数 函 数 : 

[logt il] 41 i*0 


Gi) =f i=0 


如 图 1-10 所 示 的 表 给 出 了 对 于 操作 数 a 的 3 种 可 能 形式 ， 对 数 代 价 i(a) 。 图 1-11 归纳 
了 每 条 指令 所 需 的 时 间 开 销 。 


t(a) 

l(c(0) + KD) 

l(c(0)) + Ei)  K(c() 
i{c(0)) + tla) 

Kc(0)) + r(a) 

l(c(0)) + t(a) 

{l(c(0)) + r(a) 


l(input) + (i) 

K(input) + ((i) + l(c(i)) 
t(a) 

1 

l(c(0)) 

I(e(0)) 


i Ki) 
i Ki) + KcG) 
*i KG) + Ke(i))  K(c(c(i))) 









图 1-10 操作 数 的 对 数 代价 图 1-11 RAM 指令 的 对 数 代 价 ， 这 里 (a) 
表示 操作 数 a 的 开销 ，6 是 标号 


这 里 考虑 的 事实 是 ， 在 一 个 寄存 器 中 表示 整数 需要 [logn ] +1 位 ， 而 前 面 说 一 个 寄存 器 可 
以 存放 任意 大 小 的 整数 。 

对 数 代 价 模型 基于 如 下 粗略 假设 ， 执 行 一 条 指令 的 代价 和 指令 的 操作 数 的 长 度 成 比例 。 例 
如 ， 考 虑 指令 ADD * i 的 代价 。 首 先 必须 考虑 对 操作 数 的 地 址 进行 解码 的 开销 。 检 查 整 数 i 需要 
时 间 LCi). Ria, BEM c(i) ， 即 寄存 器 i 的 值 ， 再 定位 寄存 器 c(i) ， 需 要 时 间 !(e(i) ) 。 最 后 读 


取 寄 存 器 ce( 引 的 内 容 ， 需 要 时 间 !(ce(c(i) ) ) 。 由 于 指令 ADD « i 是 将 c(c(i)) 的 值 和 累加 器 中 的 
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整数 <(0) 相 加 ， 可 以 看 出 Kec(0)) 1G) +1(c(i)) +1(c(e(i)) ) eH ADD * i 的 合理 的 时 间 
开销 。 

定义 一 个 RAM 程序 的 对 数 空间 复杂 度 是 !(x; ) 值 的 和 ， 这 里 x; 是 包括 累加 器 在 内 的 所 有 寄 
存 器 i 在 计算 过 程 中 所 存放 过 的 最 大 整数 。 

对 于 给 定 的 程序 使 用 统一 代价 标准 或 对 数 代价 标准 可 能 会 得 到 非常 不 同 的 时 间 复 杂 度 分 析 
结果 。 如 果 假 定 程序 中 的 每 个 数 都 可 存放 在 一 个 计算 机 字 内 ， 则 统一 代价 函数 是 合理 的 模型 。 否 
则 ， 使 用 对 数 代价 模型 进行 实际 复杂 度 分 析 更 合适 。 

现在 考虑 例 1. 1 中 计算 n" 的 RAM 程序 的 时 间 和 空间 复杂 度 。 该 程序 的 时 间 复 杂 度 由 包含 
MULT 指令 的 循环 所 决定 。 执 行 第 i 次 MULT 指令 时 ， 累 加 器 中 包含 的 值 ， 而 寄存 器 2 则 包含 
值 n。 一 共 执 行 了 n -1 次 MULT 指令 。 在 统一 代价 标准 下 ， 每 条 MULT 花费 一 个 单元 的 时 间 ， 因 
此 执行 所 有 的 MULT 指令 花费 0(n) 时 间 。 在 对 数 代 价 模型 下 ， 执 行 第 i 条 MULT 指令 花费 的 时 
fal f& 1(n') +1(n) (i *1)log rn， 因此 MULT 总 的 执行 时 间 是 


> (i +1)logn 
Bi O(n’ log n), 
空间 复杂 度 由 存储 于 寄存 器 0 ~3 中 的 整数 所 确定 。 在 统一 代价 标准 下 空间 复杂 度 是 简单 的 
0(1) 。 在 对 数 代价 标准 下 ， 空 间 复杂 度 是 0(n log n) 。 因 此 对 于 例 1. 1， 程 序 的 复杂 度 如 下 : 


时 间 复 杂 度 O(n) O(n? log n) 
空间 复杂 度 O(D O(n log n) 


对 于 该 程序 ， 仅 当 一 个 计算 机 字 能 存放 一 这 样 大 的 整数 时 ， 使 用 统一 代价 标准 才 是 现 
实 的 。 如 果 nw" 无 法 存放 在 一 个 计算 机 字 内 ， 由 于 假定 整数 i 和 j 相 乘 需 时 间 OCC) €16)), 
而 这 是 否 可 能 尚 不 清楚 ， 因 此 有 时 甚至 使 用 对 数 代价 标准 来 衡量 算法 的 时 间 复 杂 度 也 是 不 
实际 的 。 

对 于 例 1.2 中 的 RAM EF, BE n 是 输入 串 的 长 度 ， 其 时 间 和 空间 复杂 度 如 下 : 












空间 复杂 度 0n) O (n log n) 
对 于 这 个 程序 ， 如 果 不 能 存放 在 一 个 计算 机 字 内 ， 则 对 数 代价 标准 更 现实 。 
1.4 存储 程序 模型 


由 于 RAM 程序 并 不 存放 在 RAM 的 内 存 中 ， 因 此 程序 不 能 对 自身 进行 修改 。 现 在 考虑 一 种 
称 为 随机 存 取 存 储 程序 计算 机 (RASP) 的 模型 ， 它 和 RAM 模型 类 似 ， 唯 一 的 不 同 点 是 程序 存放 
在 内 存 之 中 并 且 可 以 修改 。 

RASP 的 指令 集 和 RAM 基本 一 样 ， 不 同 之 处 是 没有 间接 寻 址 指令 ， 原 因 是 不 需要 。RASP 可 
以 在 程序 执行 过 程 中 修改 指令 来 仿真 间接 寻 址 。 

RASP 的 总 体 结 构 也 和 RAM 相似 ， 但 RASP 的 程序 存放 在 内 存 的 寄存 器 之 中 。 每 条 RASP 指 
令 占 用 两 个 连续 的 内 存 寄存 器 。 第 1 个 寄存 器 存放 表示 操作 码 的 代码 ， 第 2 个 寄存 器 存放 地 址 。 
如 果 地 址 的 形式 是 =i， 则 第 1 个 寄存 器 存放 的 代码 将 表示 第 2 个 寄存 器 的 内 容 是 i。 使 用 整数 对 
指令 进行 编码 。 图 1-12 给 出 一 种 可 能 的 编码 。 例 如 ， 指 令 LOAD = 32 将 在 一 个 寄存 器 中 存放 


A MB. LOL n A oA oo omo Ram mon n a BH oa A 


+H Re 9 


值 2 而 在 紧 接 的 寄存 器 中 存放 值 32。 
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Æ 1-12 RASP 指令 编码 


相应 于 RAM, RASP 的 状态 可 表示 如 下 : 

1. 内 存 映 射 <， 对 所 有 120, cli) SERERE LIEBER; 

2. 位 置 计数 器 ， 其 指向 两 个 连续 寄存 器 的 第 1 个 寄存 器 ， 从 该 处 取 当 前 要 执行 的 指令 。 

开始 时 ,位 置 计数 器 设置 为 指向 某 一 指定 的 寄存 器 。 初 始 时 ， 因 为 有 装 入 的 程序 ， 内 
存 寄存 器 的 内 容 并 不 全 是 0。 但 可 假定 ， 除 了 有 限 个 寄存 器 外 ， 其 他 寄存 器 和 累加 器 的 值 都 
是 0。 除 非 指令 是 JUMPi、JGTZi( 且 累 加 器 值 是 正 数 ) 或 JZEROi( 且 累 加 器 值 为 0)， 此 时 位 
置 计数 器 的 值 设 为 i;， 否 则 每 条 指令 执行 后 ,位 置 计数 器 增加 2。 每 条 指令 的 效果 和 相应 的 
RAM 指令 一 样 。 

RASP 程序 的 时 间 复 杂 度 的 定义 非常 类 似 于 RAM。 既 可 以 使 用 统一 代价 标准 也 可 以 使 用 对 数 
代价 标准 。 但 对 于 后 者 ， 必 须 考虑 操作 数 的 计算 以 及 存 取 指令 本 身 的 代价 。 存 取 指 令 的 代价 是 
I(LC) ,这 里 LC 是 位 置 计数 器 的 值 。 例 如 ， 执 行 存放 在 寄存 器 j 和 j+1 中 的 指令 ADD =i 的 代价 
ÆG) +1(c(0)) +i)? 

执行 存放 在 寄存 器 和 7 € 1 中 的 指令 ADDi BARGE 1G) €1(0(0) ) +L) +l(e(i))。 

RAM 程序 的 计算 复杂 度 和 RASP 程序 的 计算 复杂 度 的 不 同 之 处 在 哪里 ? 答案 并 不 令 人 意外 。 
一 个 模型 中 时 间 复 杂 度 为 7F(n) 的 从 输入 到 输出 的 映射 ， 在 另 一 个 模型 中 在 时 间 AT (rn) 内 完成 (上 
为 常数 ) ， 无 论 统一 代价 还 是 对 数 代 价 均 如 此 。 类 似 地 ， 在 这 两 种 代价 模型 下 ， 这 两 个 模型 所 耗 
用 的 空间 也 仅 差 常数 倍 。 

下 面 两 个 定理 形式 化 地 阐述 了 上 述 关系 。 定 理 的 证 明 是 通过 说 明 一 个 RAM 算法 可 以 由 一 个 
RASP 算法 进行 仿真 ， 反 之 亦 然 。 

定理 1.1 不 管 指令 代价 是 统一 的 或 者 是 对 数 的 ， 对 于 每 一 个 时 间 复 杂 度 为 T(n) 的 RAM € 
F, 都 存在 一 个 常数 k， 使 得 存在 一 个 等 价 的 时 间 复 杂 度 为 kT(n) 的 RASP 程序 。 

证 明 : 下 面 说 明 如 何 用 一 个 RAS 程序 来 仿真 一 个 RAM 程序 P。RASP 的 寄存 器 1 用 
来 暂时 存储 RAM 累加 器 的 内 容 。 现 在 由 P 构造 一 个 RAS AJF P., P 占用 RASP 接 下 来 
的 r-1 个 寄存 器 。 常 数 r 由 RAM 程序 PRE. RAM 寄存 器 i 的 内 容 存放 在 RASP 寄存 器 
r+i 中 ,其 中 i=1， 由 此 所 有 对 RASP 程序 的 内 存 引 用 都 比 对 相应 的 RAM 程序 的 内 存 引 
用 多 r。 

每 一 条 没有 包含 间接 引用 的 RAM 程序 P 的 指令 可 直接 编码 为 相同 的 RASP 指令 (内 存 引用 
可 能 适当 增加 ) 。 每 一 条 包含 间接 引用 的 RAM 程序 P 的 指令 都 可 映射 为 通过 更 改 指令 以 仿真 间 
接 寻 址 的 6 条 RASP 指令 序列 。 





O 也 可 考虑 读 取 寄 存 器 j+1 的 代价 ， 但 和 1!(7) 没有 大 的 不 同 。 另 外 本 章 不 关心 常数 因子 ， 而 是 考虑 画 数 的 增长 
R, WEI +1G+1)“ 近 似 " 于 1() ， 即 相差 最 多 3 fho 








10 git 





下 面 的 例子 足以 说 明 如 何 进行 间接 寻 址 仿真 。 为 了 仿真 RAM 指令 SUB * ;， 其 中 i 是 一 个 正 
整数 ， 现 编译 RASP 指令 序列 如 下 : 
- 将 累加 器 中 的 内 容 临时 存放 在 寄存 器 1 中 ; 
- 将 寄存 器 r+i 的 内 容 装 和 累加 器 中 (R RASP 模型 的 寄存 器 + +i 对 应 于 RAM 模型 的 寄存 器 i) ; 
. 将 累加 器 内 容 加 7; 
. 将 第 3 步 得 到 的 结果 作为 SUB 指令 的 地 址 域 存储 ; 
从 临时 寄存 器 1 恢复 累加 器 的 值 ， 
最 后 ， 使 用 第 4 步 创 建 的 SUB 指令 执行 减法 运算 。 


Ot bh wWDN = 





STORE 11! 
LOAD l 


SUB b 这 里 5b 是 
RAM 寄 存 器 ;的 内 容 


1-13 通过 RASP 模型 仿真 指令 SUB * i 


例如 ， 使 用 图 1-12 给 出 的 RASP 指令 编码 并 假定 RASP 指令 系列 开始 于 寄存 器 100， 图 1-13 
所 示 为 SUB * i 的 仿真 指令 序列 。 偏 移 量 r 在 得 到 RASP 程序 P, 后 就 可 以 确定 。 

可 以 观察 到 每 条 RAM 指令 最 多 需要 6 条 RASP 指令 ， 因 此 在 统一 代价 标准 下 RASP 指令 的 
复杂 度 最 多 为 67(n) 。( 注 意 该 度量 与 确定 输入 “规模 ”的 方法 无 关 。) 

在 对 数 代价 模型 下 ，P 中 的 每 条 RAM 指令 7 可 以 被 P, 下 1 条 或 6 条 指令 序列 S 仿真 。 可 以 
看 到 存在 一 个 依赖 于 尸 的 常数 上 ， 使 得 S 中 的 指令 代价 不 大 于 指令 了 的 代价 的 大 售 。 

例如 ，RAM 指令 SUB * i 的 代价 为 

M -1(c(0)) +1(i) *I(c(i) ) *l(e(e(i))) 

仿真 该 RAM 指令 的 RASP 指令 序列 S 如 图 1-14 所 示 ， 其 中 ec(0) c(i) Mc(c(i) ) JE RAM E 
存 器 的 内 容 。 因 为 P, 占用 RAS 的 寄存 器 2 ~r， 由 此 , j<r -11。 由 于 1(x+y) <1(x) *l(y), 
因此 ，5 的 代价 肯定 小 于 





21(1) +4M +11l(r) <(6+111(7r))M 


STORE 1 lG) HO) + H(c(0)) 
i Kj+2) + r+ i) + l(c(i)) 
lC 4 4) + K(c()) + U(r) 
STORE /+ 11 I(j * 6)  j 1) + (c(i) +r) 
LOAD 1 I(j 8) - 10) + K(c(0)) 
SUB 一 I(j &- 10) + l(c(i) +r) + K(c(0)) 
+ l(c(c(i))) 


图 1-14 RASP 指令 的 代价 








- 4 — & ^. ff on un fot: 
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由 此 可 得 结论 ， 存 在 一 个 常数 上 =6+11(r) ， 使 得 车 P 的 时 间 复 杂 度 为 T(n)， 则 P, on 
复杂 度 为 kT(n)。 

定理 1.2 不 管 指令 代价 模型 是 统一 的 或 者 是 指数 的 ， 对 于 每 一 个 时 间 复 杂 度 为 T(n) " 
RASP 程序 ， 都 存在 常数 上 ， 使 得 存在 一 个 等 价 的 时 间 复 杂 度 为 K7(m) 的 RAM 程序 。 

证 明 : 要 构造 的 仿真 RASP 的 RAM 程序 将 使 用 间接 寻 址 以 解码 并 仿真 存放 在 RAM 内 存 中 的 
RASP 程序 。 其 中 一 些 RAM 的 寄存 器 有 特殊 的 使 用 目的 : 

寄存 器 1 一 一 用 作 间 接 寻 址 ， 

寄存 器 2 一 一 RASP 的 位 置 计数 器 ， 

寄存 器 3 一 一 存储 用 作 RASP 的 累加 器 。 

RASP 的 寄存 器 i 存放 在 RAM 的 寄存 器 i+3 SP, izl, 

RAM 将 长 度 有 限 的 RASP 程序 存放 在 开始 于 寄存 器 4 的 内 存 中 。 寄 存 器 2， 即位 置 计数 器 的 
值 为 4， 而 寄存 器 1 和 3 的 值 为 0。RAM 程序 包含 一 个 仿真 循环 ， 其 中 首先 读 取 一 条 RASP 指令 
(LOAD * 2 的 RAM 指令 ) ， 然 后 译 码 ， 转 移 到 18 种 不 同 的 指令 集 之 一 ， 每 个 指令 集 处 理 一 种 类 
型 的 RASP 指令 。 对 于 无 效 的 RAM 操作 码 ， 和 RASP 类 似 ， 将 停机 。 

译 码 和 转移 操作 是 非常 直接 的 ， 例 1.2 可 以 作为 一 个 模型 (虽然 此 例 中 解码 的 符号 是 来 自 输 
和 人 和， 而 现在 是 从 内 存 读 取 )。 图 1-15 是 仿真 RASP 指令 6， 即 SUBi 的 RAM 指令 序列 ， 当 
c(c(2)) =6， 即 位 置 计 数 器 指向 一 个 含有 6(SUB 的 编码 ) 的 寄存 器 时 该 程序 被 激活 。 


ADD 寄存 器 


LOAD ] 将 位 置 计 教 器 的 值 增 1， 使 其 指向 包含 SUB 指令 的 操作 数 ;的 
-1 
STORE 


2 

LOAD +2) 将 i 存 入 累加 器 ， 加 3， 再 将 结果 存放 在 寄存 器 1 中 

ADD =3 

STORE 1! 

LOAD | 从 寄存 器 3 中 得 到 RASP 累加 器 的 内 容 ， 减 去 寄存 器 i+3 的 值 ， 将 


SUB "I 
STORE 3 
LOAD 2 

ADD = { 再 次 将 位 置 计数 器 的 值 增 1， 使 其 指向 下 一 条 RASP 指令 
STORE 2 

JUMP a 返回 到 循环 仿真 指令 序列 的 开始 处 (假定 是 “a”) 


结果 放 回 寄存 器 3 中 





图 1-15 仿真 SUBi 的 RAM 代码 


这 里 省 略 掉 RAM 程序 构造 的 进一步 细节 。 请 读者 自行 证 明 : TERR- RIMANERE 
代价 模型 ，RAM 程序 的 时 间 复 杂 度 最 多 是 RASP 程序 的 常数 倍 。 

从 定理 1.1、 定 理 1.2 可 以 得 出 以 下 结论 ， 对 于 时 间 复 杂 度 (空间 复杂 度 也 是 ， — 
J), RAM 模型 和 RAS 模型 是 常数 因子 等 价 的 ， 也 就 是 说 相同 的 算法 在 两 个 模型 下 复杂 度 的 阶 
是 一 样 的 。 涉 及 这 两 个 模型 时 ， 本 书 通常 将 使 用 较 简单 的 RAM BUS, 


1.5 RAM 的 抽象 


对 于 许多 情况 ，RAM 和 RASP 比 问题 所 需要 的 计算 模型 复杂 。 下 面 将 定义 若干 对 RAM BERI 
的 一 些 属性 进行 抽象 而 忽略 其 他 特性 的 模型 。 考 虑 准则 是 所 忽略 的 指令 的 代价 最 多 占 应 用 该 模 
型 的 任何 有 效 算 法 的 代价 的 常数 部 分 。 
|. 直线 状 程序 

第 一 个 考虑 的 模型 是 直线 状 程序 模型 。 对 许多 问题 来 说 ， 有 理由 仅 考虑 如 下 RAM 程序 ， 其 
中 转移 指令 仅 用 于 表示 一 些 指 令 序列 的 执行 会 重复 m 次 ， 这 里 ”是 问题 的 输 和 规模。 在 这 种 情况 
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下 ， 可 以 对 重复 次 的 指令 序列 进行 适当 次 数 的 复制 而 “展开 "程序 ， 其 结果 就 是 长 度 可 能 增加 
倍 的 直线 状 程序 (无 循环 ) 。 

例 1.3 考 虚 两 个 nxn 的 整数 矩阵 相 乘 。 可 以 认为 在 RAM 程序 中 一 个 循环 被 执行 的 次 数 独 
立 于 实际 的 矩阵 元 素 的 取 值 。 因 此 ， 假 定 程序 中 出 现 的 循环 测试 条 件 语句 仅 涉 及 n， 即 问题 的 规 
模 ， 这 是 一 个 有 用 的 简化 。 例 如 ， 和 扼 阵 乘法 算法 显然 涉及 恰好 执行 mn 次 的 循环 ， 即 其 包含 和 z 进 
行 比较 的 转移 指令 。 口 

将 一 个 程序 展开 为 直线 状 程序 可 以 省 却 分 支 指 令 。 展 开 的 理由 是 在 许多 问题 中 ， 用 于 控制 
循环 的 分 支 指令 的 代价 总 和 只 是 整个 RAM 程序 代价 的 常量 因子 。 同 样 ， 通 常 也 可 假设 输入 语句 
也 是 程序 总 代价 的 一 个 常量 因子 ， 因 此 可 以 假设 大 小 为 n 的 有 限 输入 集 在 程序 开始 时 就 已 经 存放 
在 内 存 中 。 另 外 ， 如 果 用 于 间接 寻 址 的 寄存 器 包含 的 值 仅 依赖 于 n， 而 与 输入 的 变量 值 无 关 ， 那 
么 间接 寻 址 的 影响 当 固定 时 也 可 以 确定 。 由 此 ， 可 以 假定 直线 状 程序 不 包含 间接 寻 址 指令 。 

另外 ， 由 于 每 一 直线 状 程序 仅 引 用 有 限 个 内 存 寄存 器 ， 由 此 可 方便 地 对 程序 使 用 的 寄存 器 
命名 ， 即 可 使 用 符号 地 址 (符号 或 字符 串 ) 而 不 是 整数 来 引用 寄存 器 。 

消去 READ, JUMP, JGTZ, JZERO 之 后 ， 所 剩 下 的 指令 还 包括 LOAD, STORE, WRITE, 
HALT 以 及 RAM 指令 系统 中 的 算术 运算 等 。 由 于 程序 的 结束 必然 是 程序 的 停止 ， 因 此 HALT 指 
令 也 是 不 需要 的 。 另 外 ， 还 能 通过 指定 某 一 符号 地 址 作为 输出 变量 而 免 去 WRITE 指令 ， 此 时 在 
程序 停止 时 ， 这 些 她 址 持 有 的 值 就 是 程序 的 输出 。 

最 后 ， 通 过 使 用 下 面 的 指令 序列 可 将 LOAD 和 STORE 指令 和 算术 指令 结合 在 一 起 ， 如 将 


LOAD a 
ADD b 
STORE cœ 


用 cca +6 替换 。 由 此 ， 直 线 状 程序 的 整个 指令 集 为 : 
xy 十 和 
xey -z 
zey *z 
z€—y/z 
xi 
这 里 x、y 和 z 是 符号 地 址 (或 变量 )， 而 i 是 一 个 常量 。 容 易 看 出 ， 累 加 器 中 由 LOAD, STORE 和 
算术 运算 组 成 的 指令 序列 都 可 替换 为 上 述 5 条 指令 组 成 的 指令 序列 。 
和 直线 状 程序 相关 的 是 两 组 指定 的 变量 ，inputs 和 outputs。 直 线 状 程序 所 计算 的 是 输入 变量 
表示 的 值 到 输出 变量 ( 按 指定 顺序 ) 表 示 的 值 的 函数 。 
例 1.4 考虑 多 项 式 求 值 
p(x) =a,x" +a, x e aux +a, 
输入 变量 是 系数 ao, a, ，…，a, 和 未 确定 的 x。 输 出 变量 是 p。 计 算 p(x) MRAM 
1. a,% +a, 对 于 n=1 
2. (a,x t a )x + a, 对 于 n=2 
3. ((a,x +a,)x ta )x +a, 对 于 n=3 
图 1-16 是 与 这 些 表达 式 对 应 的 直线 状 程序 。 对 于 任何 n， 霍 纳 规则 现在 应 该 是 清楚 的 。 对 于 任何 
—^ n, 都 有 步 数 为 2n 的 计算 阶 为 n 的 多 项 式 的 直线 状 程序 。 第 12 章 将 说 明 对 于 给 定 的 输入 系 
数 计算 一 个 任意 的 n KERR, n 次 加 法 和 次 乘法 运算 是 必需 的 。 因此 对 于 直线 状 程序 模型 ， 
使 用 才 纳 规则 的 程序 是 最 优 的 。 口 
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126 ”相应 于 霍 纳 规则 的 直线 状 程序 


在 直线 状 程序 计算 模型 下 ， 一 段 程序 序列 的 时 间 复 杂 度 是 第 个 程序 的 计算 步 数 ， 即 的 函 
数 。 例 如 ， 霍 纳 规则 产生 的 是 时 间 复 杂 度 为 2n 的 一 个 序列 。 注 意 ， 测 量 时 间 复 杂 度 和 测量 算术 
运算 的 数目 的 结果 是 一 样 的 。 程 序 序列 的 空间 复杂 度 是 涉及 到 的 变量 的 数目 ， 它 也 是 的 函数 。 
例 1.4 中 的 程序 空间 复杂 度 为 上 +4。 

定义 ” 当 涉 及 直线 状 程序 模型 时 ， 对 于 一 个 问题 ， 若 存在 一 个 时 间或 空间 复杂 度 最 多 为 
of(n) 的 程序 ，c 为 常数 ， 则 称 该 问题 的 时 间或 空间 复杂 度 为 0,(f(n))。( 记 法 0,(f(n)) 表 示 
“使 用 直线 状 程序 模 型 的 阶 为 /(n)”。 下 标 A 表示 “算术 ”， 是 直线 状 程序 代码 的 主要 特征 。) 因 
此 ,计算 多 项 式 的 时 间 复 杂 度 为 0,(n) ， 空 间 复杂 度 也 为 0,(n)。 

Hl. 按 位 计算 

直线 状 程序 模型 显然 基于 统一 代价 函数 。 正 如 前 面 所 提 及 的 ， 该 代价 模型 假设 所 有 计算 的 
量 的 大 小 “合理 "时 是 合适 的 。 对 直线 状 程序 模型 进行 简单 的 修改 就 可 得 到 对 数 代价 模型 。 该 模 
型 可 称 为 按 位 计算 模型 ， 除 了 下 面 一 些 性 质 外 和 直线 状 程序 模型 是 一 样 的 . 

1. 所 有 变量 的 值 为 0 或 1， 即 变量 是 位 变量 ，; 

2. 运算 是 逻辑 操作 而 不 是 算术 操作 。? 

用 人 表示 and，V 表示 or， 旬 表示 异 或 ，~ 表示 否定 。 

在 按 位 计算 模型 中 ， 整 数 和 整数 j 的 算术 运算 至 少 需要 (i) +1()) 步 ， 反映 了 操作 数 的 对 
数 代价 。 事 实 上 ， 已 知 最 好 的 乘法 和 除法 运算 的 算法 确实 需要 多 于 (i) +1(j) 步 来 计算 i 和 j 的 
积 和 商 。 

使 用 0s 来 表示 按 位 计算 模型 的 算法 复杂 度 的 阶 。 当 涉及 在 其 他 模型 中 的 基本 运算 ， 如 算术 
操作 时 ， 按 位 计算 模型 是 有 用 的 。 例 如 ， 在 直线 状 程序 模型 下 ， 两 个 ”位 整数 相 乘 可 在 0,(1) 步 
内 完成 ， 而 在 按 位 计算 模型 下 已 知 的 最 好 的 结果 是 0Os(nlognloglogn) 步 。 

按 位 计算 模型 的 另 一 个 应 用 领域 是 逻辑 电路 。 输 入 和 运算 为 二 进 制 的 直线 状 程序 和 计算 布 
尔 函 数 的 组 合 逻 辑 电 路 存在 一 一 对 应 的 关系 。 程 序 中 计算 的 步 数 就 是 电路 中 的 逻辑 单元 数 。 

例 1.5 图 1-17a 是 将 两 个 二 进 制 2 位 数 [ aas AL 0,6, ] 相 加 的 程序 。 输 出 变量 是 c,、c, 和 
co, Elaa] + [5,5] = [cctco]。 图 1-17a 的 直线 状 程序 计算 为 

€ =A, Db, > 
c 2 ((a, Ab,) Qa, ) Gb, 
e; 2 ((a Aba) A(a,Vb,)) V (a, Ab,) 

1-17b 是 对 应 的 逻辑 电路 。 作 为 练习 ， 读 者 请 自行 证 明 可 在 0, (=z) 步 内 完成 两 个 = 位 数 相 
加 的 操作 。 口 


© Ht RAM 的 指令 集 必 须 包含 这 些 操 作 。 


Co * Ao @ b, 
Ua ^ bo 
v+u@a, 
Ci ~v@b, 


wea v Db, 
XUAW 
yea Ab 
C0 X vy 


a) 按 位 加 程序 b) 等 价 的 逻辑 电路 





图 1-17 


Il. 位 向 量 操 作 

与 将 变量 的 值 限制 为 0 和 1 相反 的 方法 是 允许 变量 的 值 可 以 是 任意 长 度 的 位 向 量 。 实 际 上 ， 
固定 长 度 的 位 向 量 显然 对 应 于 整数 ， 因 此 ， 必 须 采 用 比 RAM 模型 更 本 质 的 自由 度 ， 即 方便 时 可 
假设 寄存 器 的 大 小 是 无 界 的 。 - 

虽然 有 一 些 算法 在 使 用 位 向 量 模型 时 ， 所 用 向 量 的 长 度 会 超出 表示 问题 规模 所 用 的 位 数 ， 
”但 大 部 分 算法 中 使 用 的 整数 的 阶 和 问题 规模 的 阶 是 一 样 的 。 例 如 ， 处 理 一 个 有 100 个 顶点 的 图 的 
路 径 问题 ， 可 使 用 长 度 为 100 的 位 向 量 来 表示 一 个 给 定 的 顶点 " 是 否 和 其 他 的 顶点 间 存 在 一 条 路 
径 ， 即 当 且 仅 当 存在 从 "到 v, 的 一 条 路 径 ， 则 与 顶点 相关 的 向 量 的 第 i 位 值 为 1。 对 于 同一 问 
题 ， 还 可 以 使 用 规模 大 小 是 100 的 整数 作为 计数 和 索引 ， 此 时 ， 需 要 使 用 7 位 的 整数 ， 而 对 于 向 
量 则 需要 100 位 。 

然而 ， 比 较 结果 并 不 全 是 一 边 倒 的 。 大 多 数 计算 机 在 一 个 指令 局 期 内 只 能 完成 一 个 字 长 度 
的 位 向 量 逻 辑 运 算 。 因 此 ， 相 应 于 一 步 完 成 的 整数 操作 ， 长 度 为 100 的 位 向 量 需 要 在 3 ~ 4 步 内 
完成 。 因 为 模型 变 得 非 现实 时 ， 问 题 的 规模 比 RAM 和 直线 状 代码 模型 更 小 ， 因 此 ， 应 用 位 向 量 
模型 的 算法 的 时 间 和 空间 复杂 度 有 时 是 有 疑问 的 本 书 使 用 0 表示 使 用 位 向 量 模型 的 阶 。 
IV. 决策 树 

前 面 已 经 讨论 了 3 种 仅 考虑 计算 步骤 而 忽略 分 支 转移 指令 的 RAM 抽象 ， 但 也 存在 一 些 问 
题 。 有 时 分 支 转移 指令 是 度量 复杂 度 的 主要 因素 。 例 如 ， 在 排序 问题 中 ， 输 出 除了 次 序 外 和 输入 
是 一 样 的 。 因 此 有 理由 考虑 这 样 的 模型 ， 全 部 代码 都 是 基于 两 个 元 素 比 较 的 两 分 支 转移 指令 。 

程序 中 表示 分 支 的 通常 工具 是 使 用 称 为 决策 树 的 二 叉 树 .9 每 个 内 部 顶点 表示 一 个 决策 。 树 


O 树 的 定义 请 参阅 2.4 节 。 
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根 所 表示 的 测试 首先 进行 ， 然 后 按照 测试 的 结果 将 “控制 "转移 给 它 的 一 个 儿子 ， 通常 ， 依 赖 于 
结 点 测试 结果 。 控 制 持续 从 一 个 顶点 转移 到 它 的 一 TF, 直到 叶子 。 所 期 望 的 结果 就 在 所 抵达 
的 叶子 之 上 。 

例 1.6 图 1-18 说 明了 对 3 个 数 a、b 和 * 进行 排序 的 决策 树 程序 。 结 点 处 圆圈 内 的 比较 式 
表示 所 进行 的 测试 ， 如 果 结 果 是 “yes”， 则 控制 转移 到 左 儿 子 ， 结 果 是 “no”， 则 控制 转移 到 右 
儿子 。 口 







Order is 
a«b«c 


Order is Order is Order is 
c«a«b b«c«a c«b«a 
图 1-18 一 棵 决策 树 


决策 树 的 时 间 复 杂 度 是 树 的 高 度 ， 是 问题 规模 的 函数 。 通 常 ， 我 们 希望 测量 的 是 最 大 的 比 
较 次 数 ， 是 从 根 到 叶子 的 路 径 长 度 。 本 书 用 OC 表示 在 决策 树 ( 比较 ) 模 型 下 算法 的 阶 。 注 意 ,一 
棵 树 的 结 点 的 总 数 通常 超过 它 的 高 度 。 例 如 ， 对 = 个 数 进行 排序 的 决策 树 至 少 有 n! 片 叶子 ， 尽 
管 其 高 度 大约 nlogn 就 足够 了 。 


1.6 一 种 基本 的 计算 模型 : 图 灵机 


为 了 证 明 计 算 一 个 特殊 函数 需要 不 可 避免 的 最 小 时 间 开 销 ， 我 们 需要 一 种 一 般 的 、 但 
比 前 面 所 讨论 的 更 加 基本 的 计算 模型 。 该 模型 的 指令 集 要 尽 可 能 少 ， 同 时 它 不 仅 能 计算 
RAM 模型 所 能 计算 的 一 切 函 数 ， 而 且 要 “差不多 ”一 样 快 。“ 差 不 多 ”的 定义 可 使 用 “多 项 式 
相关 ”概念 。 

. 定义 ” 若 存 在 多 项 式 p,(x) 和 p,(x)，, 使 对 于 所 有 n 值 ， 有 fi(n)<<pi(f(n)) 和 fo(n)< 
pi (n) ), 则 说 函数 有 (nn) 和 (nn) 是 多 项 式 相 关 的 。 

例 1.7 函数 A(n) -2n ff, (n) =n’ 是 多 项 式 相关 的 ; WS p (x) =2x， 因 为 2n? «28, > 
p,(x) 263, BR n! <<(2r)，。 然 而 ,和 2 不 是 多 项 式 相 关 的 ， 因 为 不 存在 多 项 式 p(x) ， 使 对 
FRA n A plr) 22", o 

目前 ， 使 用 如 图 灵机 这 样 的 通用 计算 模型 来 证 明 计 算 复杂 性 的 下 界 是 在 “ 较 宽 的 范围 ”进行 
的 。 例 如 ,第 11 章 说 明 某 些 问 题 需要 指数 阶 的 时 间 和 空间 。(f(n) 是 一 个 指数 函数 ， 如 果 存 在 常 
Bic, >O, k 20, 6 >0 和 >1， 对 除 有 限 个 例外 的 所 有 n, Ack <f(n) <c, 忆 。) 在 一 个 指数 的 
范围 ， 多 项 式 相 关 函 数 本 质 上 是 一 样 的 ， 因 为 和 一 个 指数 函数 是 多 项 式 相 关 的 函数 本 身 必 定 是 

一 个 指数 函数 。 

因此 有 动机 使 用 一 个 基本 的 模型 ， 在 该 模型 上 问题 的 时 间 复 杂 度 和 该 问题 在 RAM 模型 上 的 

时 间 复 杂 度 是 多 项 式 相 关 的 。 具 体 来 说 ， 使 用 的 模型 是 多 带 图 灵机 ， 以 对 数 代 价 函 数 计 ， 需 要 
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(A ]*) 时 间 完 成 一 台 RAM ARES 时间 内 究 成 的 工作 ， 但 不 会 更 多 " 。 因 此 RAM 和 图 灵 
机 模型 的 时 间 复 杂 度 是 多 项 式 相 关 的 。 
定义 ”一 台 多 带 图 灵机 (TM) 如 图 1-19 所 示 。 它 包含 上 条 右 端 无 限 的 带子 ， 每 条 带子 划分 为 
格子 ， 每 个 格子 可 以 包 食 一 个 带 符号 ， 取 自 一 个 有 限 符 号 集 。 磁 头 可 扫描 每 条 带子 的 一 个 格子 ， 
进行 读 或 写 。 图 灵机 的 操作 是 由 一 个 称 为 有 限 控制 器 的 基本 程序 确定 的 。 有 限 控制 器 总 是 处 于 
一 个 有 限 状 态 集中 的 某 一 状态 ， 该 状态 可 以 被 认为 是 程序 的 一 个 位 置 。 
下 面 是 图 灵机 上 的 一 个 计算 步骤 。 基 于 有 限 控制 器 的 当前 状态 以 及 每 个 磁头 所 扫描 的 相应 
符号 ， 图 灵机 执行 下 述 操作 中 的 一 些 或 全 部 : 
l. 改变 有 限 控制 器 的 状态 。 
2. 打印 新 的 带 符号 以 覆盖 若干 或 全 部 磁头 下 的 格子 的 当前 符号 。 
3. 独立 移动 若干 或 全 部 磁头 ， 往 左 (L) 一 格 、 往 右 (R) 一 格 或 不 变 (S) 。 
形式 化 的 描述 是 ， 一 台大 带 图 灵机 是 7 元 组 - 
(Q, T, I, 8, b, qos a) 
其 中 : 
1. 0 是 状态 的 集合 ; 
2.7 了 是 带 符号 的 集合 ; 
3.1 是 输入 符号 的 集合 ,IST; 
4.b 属 于 T-1， 是 空白 符 ; 
5. qo 是 初始 状态 ; 
6. GFE RH (HEL) RA; 
7. 8389 e, BA Ox TRI Qx (Tx |L，R，S| )* 的 映射 。 即 ， 对 包含 一 个 状态 和 个 
带 符号 的 (k+1) 元 组 ,给 出 一 个 新 的 状态 和 上 个 对 ， 每 个 对 包含 一 个 新 的 带 符号 和 磁头 
的 移动 方向 ,。 BES a, a, a) = Ca, (Ca, di), (a, d), s, 
(a'，dd) ) ， 而 图 灵机 在 状态 9， 并 将 第 i 条 磁带 的 磁头 扫描 带 符号 是 a,，1 <i<k。 接 下 
来 ， 图 灵机 进入 状态 9 ， 将 符号 a, 改 为 a ， 并 将 第 i 条 磁带 的 磁头 按照 方向 d. 移 动 ，1 <; 


xk, 





图 1-19 一 台 多 带 图 灵机 


O 事实 上 ,可 以 证 明 一 个 更 紧密 的 界 0( [An)log fn) log log f(n) ]?) , 但 由 于 这 里 关心 的 是 多 项 式 因素 ， 使 用 4 
次 方 的 界 就 可 以 了 ( 见 7.5 节 ) 。 
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可 以 使 用 一 台 图 灵机 来 识别 一 种 语言 。 图 灵机 的 带 符号 包括 输入 语言 的 字母 表 ， 称 为 输入 
符号 ， 和 一 个 特殊 符号 ， 即 记 为 的 空白 符 ， 或 许 还 有 其 他 的 符号 。 开 始 时 ， 第 一 条 带 上 包含 输 
人 符号 串 ， 从 最 左边 开始 每 个 格子 一 个 符号 。 包 含 输入 符号 串 格子 的 右边 的 所 有 格子 都 是 空白 。 
其 他 的 带子 全 为 空白 符 。 当 且 仅 当 图 灵机 从 指定 的 初始 状态 ， 即 每 一 磁头 都 处 于 磁带 最 左 的 位 
置 出 发 ， 在 进行 一 系列 的 移动 之 后 进 人 可 接受 状态 ， 称 输入 符号 串 是 可 接受 的 。 一 台 图 灵机 接受 
的 语言 是 所 有 可 接受 的 输入 符号 串 的 集合 。 





图 1-20 处 理 01110 的 图 灵机 


例 1.8 图 1-20 是 识别 字母 表 {0，1| 上 回 文 9 的 2 带 图 灵机 。 

1. 在 第 2 条 带 的 第 1 个 格子 内 写 人 特殊 的 符号 X， 并 从 第 1 条 带 复制 初始 的 输入 串 ( 见 图 1- 
20a) 到 第 2 条 带 ( 见 图 120b) ; 

2. 将 第 2 条 带 的 磁头 移 到 符号 X 所 在 的 位 置 ( 见 图 1-20c) ; 

3. 重复 如 下 动作 ， 磁 带 2 上 的 磁头 每 次 向 右 移动 1 格 同时 磁带 1 上 的 磁头 向 左 移动 1 
格 ， 并 比较 相应 磁头 读 出 的 符号 。 如 果 所 有 的 符号 都 是 匹配 的 ， 则 可 判定 输入 串 是 一 回 文 ， 
此 时 图 灵机 进入 状态 gq;。 否 则 ， 图 灵机 将 位 于 一 个 无 法 进行 合法 移动 的 位 置 ， 此 时 将 不 接 
受 字符 串 而 停机 。 

图 灵机 的 下 一 移动 函数 由 图 1-21 中 的 表 给 出 。 口 

图 灵机 的 动作 可 以 使 用 “ 瞬 像 ”进行 形式 化 描述 。 一 台 上 带 图 灵机 M 108848 (instantaneous de- 
scription, ID) 是 一 个 天 元 组 (aa ，a,，…，as) ， 其 中 a; 是 形 为 xqy 的 串 ， 其 中 xy REM 中 第 ;条 


带 上 的 串 ( 赂 去 尾 上 的 空 字 ) q EM 的 当前 状态 。 仅 挨 着 第 i 个 a 的 右边 符号 就 是 第 i 条 带 扫描 
的 符号 。 





昌 一 字符 串 若 从 前 往 后 读 与 从 后 往 前 读 一 样 则 称 为 田 文 ， 如 0100010。 


18 


^s eee 


gi* 


如 果 输入 非 空 ， 在 带 2 上 打印 X 
并 将 磁头 右 移 ， 进 入 状态 g,: 否则 


2 的 磁头 右 移 ， 并 进入 状态 q,. 在 
qo Wm 2 上 的 碰头 过 到 b, 进 
入 状态 4s PERRA: 否则 左 


图 1-21 识别 回 文 的 图 灵机 的 下 一 移动 函数 


如 果 经 图 灵机 M 一 次 移动 后 瞬 像 D, EUR. D, MEX D, ha 
D, 上 读 为 “ 转 成 ”, 或 “进入”)。 车 D, ha D, hae ha D, ， 对 于 某 个 nm 
22, Wid D, la D,- FD=D'RD kD’, WitwD iD’. 

上 带 图 灵机 M = (Q, T, 1, 8, b, qo, q) RKB aa, a, X 
中 ci; 属于/ I<iga, an FR (quaa, a, fo» doo s qo) fa (a, 
o，…，ak) ， 其 中 某 个 0 818 que 

例 1.9 图 1-22 是 图 1-21 表示 的 图 灵机 对 于 输入 010 的 瞬 像 序 
列 。 由 于 gs; 是 最 终 状 态 ， 因 此 该 图 灵机 接受 010。 口 

除了 作为 语言 接收 器 的 自然 解释 之 外 ， 图 灵机 还 被 认为 是 用 于 
计算 函数 /的 设备 。 函 数 的 参数 编码 为 输入 带 上 的 符号 让 *， 使 用 特 
殊 的 符号 如 # 来 分 开 不 同 的 参数 。 如 果 图 灵机 停机 时 ， 作 为 输出 的 带 
上 有 整数 y( 函数 的 值 ) ， 则 说 f(x) =y。 因 此 ， 计 算 一 个 函数 的 过 程 
和 接受 一 个 语言 的 过 程 有 稍 许 不 同 。 

图 灵机 M 的 时 间 复杂 度 T(n) 是 M 在 处 理 任何 长 度 为 = 的 输入 
时 计算 的 最 大 步 数 。 如 果 对 于 某 个 长 度 为 4 的 输入 ， 图 灵机 不 停机 ， 





(4,010, gy) | (4,010, Xq) 


| (04,10, X0g,) 

+ 014,0, X01q,) 
上 (010q,, X010q,) 
f- (0109, X01g,0) 
+ (010d, X09,10) 
F- (01095, Xq,010) 
+ (010g, qsX010) 


+ (019,0, X9,010) 
上 (01,0, X09,10) 
+ (09,10, X04310) 
上 (09410, X019,0) 
+ (9:010, X019,0) 
F (q,010, X0109) 
上 (gs010, X0109)) 





1-22 ”图 灵机 的 ID 序列 


则 Tn) 对 该 值 无 定义 。 图 灵机 的 空间 复杂 度 S(n) 是 在 处 理 长 度 为 n 的 输入 时 ， 磁 头 离开 带子 左 
端的 最 大 距离 。 如 果 有 一 条 带子 的 磁头 往 右 无 限 移动 ， 则 S(n) 无 定义 。 本 书 使 用 Om 表示 图 灵 
机 模型 下 的 复杂 度 。 


例 1. 10 ” 当 输 入 确实 是 一 串 回 文 时 ， 可 以 验证 图 1-21 中 图 灵机 的 时 间 复 杂 度 T(n) - 4n + 
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3， 空 间 复杂 度 S(n) 2n 42, 口 
1.7 图 灵机 模型 和 RAM 模型 的 关系 


图 灵机 (TM) 模型 的 主要 应 用 是 确定 求解 给 定 问题 所 需 的 时 间 和 空间 的 下 界 。 大 多 数 情 况 
下 ， 所 能 确定 的 是 多 项 式 相 关 范 围 的 下 界 。 要 推出 更 紧密 的 下 界 则 需要 具有 更 明确 细节 的 模型 。 
幸运 的 是 ， 在 RAM 或 RASP 上 的 计算 和 TM. 上 的 计算 是 多 项 式 相关 的 。 

本 节 考虑 RAM 和 TM 模型 的 相关 性 。 显 然 ， 让 RAM 的 每 个 寄存 器 包括 TM 带子 上 每 个 格子 
的 内 容 ，RAM 能 仿真 一 台 带 TM。 特 别 是 , 第 j 条 带子 的 第 i 个 格子 的 内 容 可 存放 在 第 所 +j+c 
寄存 器 上 ， 其 中 c 是 一 个 常量 ,表示 RAM“ 工 作 空 间 ”。 工 作 空 间 中 有 上 个 用 于 存放 TM 的 上 个 磁 
头 的 位 置信 息 的 寄存 器 。TM 带子 上 的 格子 内 容 可 由 RAM 通过 引用 存 有 磁头 位 置 的 寄存 器 使 用 
间接 寻 址 进行 读 取 。 

假定 TM 的 时 间 复 杂 度 为 T(n) >n, AFE RAM 可 以 读 取 输 入 ， 然 后 将 输入 存放 在 模拟 第 1 
条 磁带 的 寄存 器 上 ， 若 使 用 统一 代价 函数 就 可 在 0(T(n) ) 内 仿真 TM 计算 ， 若 使 用 对 数 代 价 模 
型 则 可 在 O( T(n)logT(n) ) 内 仿真 TM 计算 。 不 管 如 何 ，RAM 程序 计算 的 时 间 开 销 的 上 界 是 和 
TM 上 计算 的 开销 是 多 项 式 相关 的 ， 因 为 任何 0(T(n)logT(n) ) 函数 肯定 是 O(T (n) ) 的 。 

对 于 道 向 仿真 ， 仅 对 使 用 对 数 代价 函 数 的 RAM 模型 是 有 效 的 。 在 统一 代价 模型 下 ， 一 个 没 
有 输入 的 n 步 RAM 程序 可 以 得 到 高 达 2? 的 整数 值 ， 需 要 2“ 个 TM 格子 来 存放 和 读 取 。 因 此 ， 在 
统一 代价 下 ，RAM 和 TM 之 间 不 存在 多 项 式 相关 性 是 显然 的 (习题 1. 19) 。 

虽然 由 于 简单 性 ， 在 分 析 算 法 时 倾向 于 使 用 统一 代价 函数 ， 但 当 想 证 明 算 法 时 间 复 杂 度 的 
下 界 时 则 不 行 。 使 用 统一 代价 的 RAM 模型 当 涉 及 的 数 没有 过 大 而 超过 问题 规模 比例 时 是 比较 合 
理 的 。 但 正如 前 面 提 到 的 ，RAM 模型 下 数 的 大 小 像 被 “ 扫 到 地 毯 下 的 垃圾 ”， 很 少 能 得 到 有 用 的 
下 界 。 而 对 于 对 数 代价 ， 则 有 下 面 的 定理 。 

定理 1.3 令 工 是 使 用 对 数 代 价 标准 的 RAM 程序 在 时 间 复 杂 度 T(n) 内 接受 的 语言 。 如 果 
RAM 程序 不 使 用 乘法 或 除法 ， 则 最 多 花费 O(TP(n)) 时 间 , 工 就 可 被 一 台 多 带 图 灵机 接受 。 
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1-23 RAM 的 TM 表示 


证 明 : 将 所 有 内 容 不 为 0 的 寄存 器 表示 为 图 1-23 Bros i 1, KEREC, e) 的 序列 ， 用 
抹 去 高 位 端的 0， 并 用 符号 “#" 隔 开 的 二 进 制 表示 。 对 于 每 个 j，c, 是 RAM 寄存 器 的 内 容 。RAM 
累加 器 的 内 容 以 二 进 制 的 形式 存放 在 第 2 条 带 上 ， 第 3 条 带 则 用 作 工 作 存储 。 另 外 两 条 带 则 用 于 
存放 RAM 输入 和 输出 的 内 容 。RAM 程序 的 每 一 步 表 示 为 TM 的 一 个 有 限 状 态 集 。 本 书 并 不 打算 
描述 对 任意 的 RAM 指令 的 仿真 ， 仅 考虑 指令 ADD * 20 和 STORE30 的 仿真 ， 目 的 是 理 清 技术 上 思 
Bko XF ADD * 20， 可 设计 能 完成 如 下 工作 的 TM: 
l 在 带 1 上 查找 相应 于 RAM 寄存 器 20 的 位 置 ， 即 序列 ##10100#。 如 果 找 到 ， 则 将 其 后 的 
整数 ， 即 寄存 器 20 的 内 容 ， 写 到 带 3。 如 果 没 有 找到 ， 则 停机 。 若 寄存 器 20 的 内 容 为 0， 
则 无 法 进行 间接 寻 址 。 
2. 在 带 1 上 查找 是 否 有 RAM 寄存 器 其 编号 存储 在 带 3 上 。 如 果 找 到 ， 则 将 其 内 容 复制 到 带 
3。 如 果 没 有 找到 ， 则 写 入 0。 
3. 将 第 2 步 放置 在 带 3 上 的 数 和 带 2 上 的 累加 器 中 的 内 容 相 加 。 
为 了 仿真 指令 STORE 30， 可 设计 能 完成 如 下 工作 的 TM: 
l. 在 带 1 上 查找 相应 于 RAM 寄存 器 30 ADEL, BD4S111046, 
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2. 如 果 找 到 ， 将 准 11110# 右 边 的 所 有 符号 ， 除 了 直接 紧 随 的 整数 (寄存 器 30 的 旧 内 容 ) 以 
外 ,复制 到 带 3。 然 后 将 累加 器 的 内 容 ( 带 2) 直接 复制 到 检 11110# 的 右边 ， 再 将 带 3 的 内 
容 写 回 。 
3. 如 果 在 带 1 上 没 找到 寄存 器 30， 则 磁头 移动 至 最 左 的 空白 处 ， 打 印 11110#， 接 着 打印 累 
加 器 的 内 容 和 分 隔 符 “ 撩 ”。 
稍微 想 一 下 就 可 以 确信 ， 可 以 使 用 一 台 TM 来 忠实 仿真 RAM 模型 ， 但 还 必须 说 明 一 个 对 数 
代价 为 上 的 RAM 计算 最 多 需要 图 灵机 上 0( 廊 ) 步 的 计算 。 注 意 如 下 现象 ,除非 一 个 寄存 器 的 当 
前 值 在 先前 某 一 时 间 存 于 其 内 ， 和 否则 该 寄存 器 是 不 会 在 带 1 中 出 现 的 。 将 6 存放 于 寄存 器 的 代 
Pre (o) +i(i)， 在 一 个 常数 的 误差 下 ， 这 和 表示 #ii#c, 振 的 长 度 是 一 样 的。 由 此 ， 可 以 得 到 带 
1 的 非 空白 符 部 分 的 长 度 为 0(&) 。 
因为 主要 的 开销 是 对 带 的 搜索 ， 因 此 任何 非 STORE 指令 的 仿真 开销 和 带 1 的 长 度 是 同一 阶 
的 ， 即 0(k) 。 同 样 ， 一 条 STORE 指令 的 代价 最 多 为 对 带 1 的 搜索 代价 加 上 复制 该 带 内 容 的 代 
价 ， 两 者 都 是 O(k) 。 因 此 一 条 RAM 指令 (除了 乘法 和 除法 指令 ) 可 以 在 TM 中 使 用 至 多 0(k) 步 
进行 仿真 。 因 为 一 条 RAM 指令 在 对 数 代价 下 至 少 花费 一 个 单位 的 时 间 ， 因 些 可 以 证 明 TM 的 总 
花费 时 间 是 OCA?) 口 
如 果 一 个 RAM 程序 采用 乘法 和 除法 指令 ， 那 么 可 以 编写 使 用 加 法 和 减法 指令 的 TM 子 例 程 
来 实现 它们 。 读 者 可 以 自行 证 明 在 对 数 代价 下 这 些 子 例 程 的 代价 不 多 于 它们 所 仿真 的 指令 的 对 
数 代价 的 平方 。 因 此 ， 不 难 证 明 如 下 定理 。 
定理 1.4 在 对 数 代 价 下 ，RAM 模型 、RASP 模型 和 多 带 图 灵机 模型 是 多 项 式 相关 的 寞 型。 
证 明 : 使 用 定理 1.1、 定 理 1. 2 和 定理 1. 3 以 及 对 乘法 和 除法 子 例 程 的 分 析 。 口 
对 于 空间 复杂 度 也 有 同样 的 结论 ， 但 结果 没有 那么 有 意思 。 


1.8 简化 ALGOL 一 一 一 种 高 级 语言 


尽管 计算 复杂 度 可 借助 于 RAM, RASP 或 图 灵机 上 的 操作 步 数 进行 度量 ， 但 一 般 不 使 用 也 不 
必用 如 此 基本 的 机 器 指令 来 描述 算法 。 为 了 更 清晰 地 描述 算法 ， 本 书 将 使 用 一 种 高 级 语言 ， 即 简 
化 ALGOL 语言 。 

一 个 简化 ALGOL 语言 程序 可 以 直接 转化 为 RAM R RAS UT, 更 精确 地 说 ， 这 实际 
上 是 简化 ALGOL 语言 编译 器 的 任务 。 然 而 ， 本 书 并 不 关心 将 简化 ALGOL 语言 的 程序 转 
化 为 RAM 代码 或 RASP 代码 的 细节 。 本 书 的 目的 是 关注 执行 简化 ALGOL 语句 所 需 的 时 间 
和 空间 开销 。 

和 其 他 传统 程序 设计 语言 不 同 ， 简 化 ALCOL 语言 将 使 用 任何 类 型 的 数学 表达 式 ， 只 要 表达 
式 含义 清楚 并 且 容 易 翻 译 为 RAM R RASP 代码 即 可 。 类 似 地 ， 该 语言 也 没有 固定 的 数据 类 型 集 。 
变量 可 以 是 整 型 、 字 符 串 类 型 和 数组 类 型 。 额 外 的 数据 类 型 如 集合 、 图 、 表 和 队列 等 ， 也 可 以 在 
需要 的 时 候 引 入 。 本 书 会 尽 可 能 避免 对 数据 类 型 进行 形式 说 明 。 一 个 变量 的 数据 类 型 和 其 作用 
域 .? 可 以 从 其 名 字 或 上 下 文 识别 出 来 。 

简化 ALGOL 使 用 传统 的 数学 和 程序 设计 语言 结构 ， 如 表达 式 、 条 件 、 语 句 和 过 程 等 。 
下 面 是 一 些 此 类 结构 的 非 形式 化 描述 。 对 它们 的 精确 定义 超出 了 本 书 的 范围 。 要 认识 到 ， 
虽然 没有 细节 的 精确 说 明 ， 还 是 可 以 写 出 程序 ， 因此 ， 尽 可 能 忽略 无 关 的 细节 ， 本 书 ( 希 
望 ) 如 此 进行 。 





O 变量 的 作用 域 是 一 个 环境 ， 在 其 中 该 变量 有 意义 。 例 如 ， 一 个 求 和 算 符 的 指标 的 作用 域 仅 仅 在 求 和 表达 式 中 有 
定义 ， 在 求 和 表达 式 外 是 没有 意义 的 。 
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简化 ALGOL 程序 包括 如 下 类 型 的 语句 。 


. variable — expression 
2. if condition then statement else statement? 
3a. while condition do statement 
b. repeat statement until condition 
for variable < initial-value step step-size until final-value do statement? 
label: statement 
goto label 
begin 
statement; 
statement; 


naua 


statement; 
statement 


end 
8a. procedure name (list of parameters): statement 
b. return expression 
c. procedure-name (arguments) 
9a. read variable 
b. write expression 
10. comment comment 


11. 其 他 形式 的 语句 
下 面 是 这 些 语句 类 型 的 一 个 简要 说 明 。 


1. 赋值 语句 
variable«—expression 
计算 人 一 右边 表达 式 的 值 ， 并 将 结果 赋予 二 -左边 的 变量 。 赋 值 语 句 的 时 间 复 杂 度 是 计算 表达 式 的 时 间 加 
上 将 值 赋予 变量 的 时 间 。 如 果 表 达 式 的 值 不 是 如 整数 这 样 的 基本 类 型 ， 那 么 一 些 情 况 下 可 以 使 用 指针 
进行 简化 。 例 如 ， 对 于 nxn MEA ALB, WUE) AB ASTER O(n’). RIT, WR B 不 再 使 
用 ， 则 只 要 使 用 重 命名 技术 就 可 以 将 时 间 控 制 在 与 n 无关 的 有 限 步 内 。 
2. 这 语句 


if condition then statement else statement 


这 之 后 的 条 件 可 以 是 值 为 true 或 false 的 任意 表达 式 。 如 果 条 件 式 为 toe， 则 then 后 的 语句 将 被 
HE. Bill else 后 的 语句 (如 果 有 的 话 ) 会 被 计算 。 站 语句 的 开销 是 计算 和 测试 条 件 式 的 开销 加 
上 计算 实际 被 执行 的 then 之 后 的 语句 或 else 之 后 的 语句 的 开销 。 

3. while 语句 


while condition do statement 
和 repeat 语句 


repeat statement until condition 


© "ese statement” 是 可 选 的 ， 该 选项 导致 所 谓 的 “悬垂 else” 歧义 性 ， 一 般 采用 传统 的 方法 ， 即 假定 .else 和 最 近 的 
未 匹配 的 then 相 匹 配 。 


© %4step-size 为 1 BÍ, "step step-size” 是 可 选 的 。 
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两 种 语句 的 目的 是 创建 循环 。 在 while 语句 中 ，whike 后 的 条 件 式 先 计算 。 如 果 条 件 式 为 
true， 则 do 后 的 语句 被 执行 。 该 过 程 一 直 重 复 直到 条 件 变 为 false 为 止 。 如 果 条 件 开 始 时 为 true， 
Xf while 语句 的 执行 最 后 停止 ， 语 句 的 执行 最 终 会 让 条 件 成 为 false。while 语句 的 代价 是 对 条 
件 多 次 求 值 的 代价 的 总 和 ， 加 上 语句 多 次 被 执行 的 代价 的 总 和 。 

除了 紧 随 repeat 之 后 的 语句 在 条 件 表达 式 之 前 被 计算 外 ，repeat 语句 的 计算 与 while 语句 类 似 。 

4. for 语句 


for variable + initial-value step step-size until final-value do statement 


initial-value, step-size 和 final-value 都 是 表达 式 。 当 step-size HIERN, variable( 称 为 索引 ) 
的 值 设 为 初始 表达 式 的 值 。 如 果 该 值 超过 了 final-value， 执 行 停止 。 否 则 do 之 后 的 语句 被 执行 ， 
variable 的 值 增加 step-size 并 再 次 和 final-value 进行 比较 。 该 过 程 一 直 进 行 直 到 variable 的 值 超过 
了 final-value, step-size 是 负数 的 情况 与 此 类 似 ， 当 variable 的 值 小 于 final-value 时 执行 停止 。 借 
鉴 前 面 对 while 语句 的 分 析 ，for 语句 的 执行 代价 是 显而易见 的 。 

上 述 分 析 完 全 忽略 了 表达 式 initial-value, step-size 和 final-value 的 求 值 是 何 时 进行 的 细节 。do 
后 面 的 语句 的 执行 很 可 能 改变 表达 式 step-size 的 值 ， 在 这 种 情况 下 每 次 对 step-size 求 值 还 是 计算 一 
次 以 后 一 直 使 用 是 有 区 别 的 。 类 似 地 ， 对 step-size 的 求 值 可 能 会 影响 final-value 的 值 ， 同 样 step-size 
的 改变 也 会 影响 终止 测试 的 结果 。 为 避免 这 些 问题 ， 本 书 将 避免 编写 这 些 含义 不 清 的 程序 。 

5. 任何 一 条 语句 都 可 以 在 其 前 面 加 上 标号 和 冒号 成 为 带 标号 的 语句 。 标 号 的 主要 目的 是 创 
建 goto 语句 的 转移 目标 。 标 号 没有 附加 的 代价 。 

6. goto 语句 

goto label 
使 带 有 该 标号 的 语句 成 为 下 一 执行 的 语句 。 与 标号 相关 的 语句 不 允许 出 现在 一 个 语句 块 内 部 ( 见 
下 面 的 第 7 点 ) BRIE goto 语句 出 现在 同一 语句 块 内 。goto 语句 的 代价 为 1。 由 于 goto 语句 会 带 
来 对 程序 的 理解 困难 ， 所 以 应 该 节俭 使 用 。goto 语句 的 主要 目的 是 跳出 一 个 while 语句 。 

7. 由 分 号 隔 开 并 包含 在 关键 字 begin 和 end 之 间 的 若干 语句 称 为 块 (block)。 由 于 块 是 一 个 
语句 ， 它 可 以 出 现在 任何 语句 出 现 的 地 方 。 通 常 ， 一 个 程序 是 一 个 块 。 块 的 代价 是 出 现在 块 内 的 
语句 代价 的 总 和 。 

8. 过 程 。 在 简化 ALGOL 中 ， 过 程 可 以 先 定义 然后 调用 。 过 程 通过 形式 如 下 的 过 程 定义 语句 定义 

procedure name( list of parameters): statement 
其 中 list of parameters 是 称 为 形式 参数 的 亚 元 变量 的 序列 。 例 如 ， 下 列 语句 定义 了 一 个 名 为 MIN 
的 函数 过 程 
procedure MIN (x, y): 
if x > y then return y else return x 
其 中 变量 x y 是 形式 参数 。 

有 两 种 过 程 形式 。 一 是 函数 ， 定 义 一 个 函数 过 程 之 后 ， 就 可 以 在 一 个 表达 式 内 使 用 函数 名 
字 和 相应 的 参数 调用 它 。 在 这 种 情况 下 ， 过 程 的 最 后 一 条 被 执行 的 语句 必须 是 retum 语句 ， 即 8 
(b), return 语句 的 执行 使 关键 字 return 之 后 的 表达 式 被 计算 ， 并 使 过 程 的 执行 停止 。 函 数 的 值 
就 是 该 表达 式 的 值 。 例 如 


A *- MIN(2 + 3, 7) 
使 4 的 值 为 5。 表 达 式 2+3 和 7 称 为 调用 过 程 的 实际 参数 。 
另 一 种 使 用 过 程 的 方法 是 通过 过 程 调 用 语句 8(e) 。 该 语句 形式 是 过 程 名 后 跟随 一 个 实 参 表 。 
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过 程 调用 语句 (通常 ) 可 以 改变 调用 程序 的 数据 。 按 这 种 方式 调用 过 程 无 需 在 过 程 定义 体内 存在 
return 语句 。 过 程 中 最 后 一 条 语句 的 执行 使 过 程 调用 语句 的 执行 结束 。 例 如 ， 下 面 的 语句 定义 了 
一 个 名 为 INTERCHANGE 的 过 程 


procedure INTERCHANGE (x, y): 
begin 

tex; 

xey; 

yet 
end 


为 了 调用 该 过 程 ， 编 写 如 下 的 过 程 调用 语句 
INTERCHANGE (A [i], A{j]) 


一 个 过 程 有 两 种 和 其 他 过 程 进 行 通信 的 方式 。 一 种 称 为 全 局 变量 。 假 定 全 局 变量 是 在 全 局 
(universal) 环境 下 隐 式 说 明 的 。 而 过 程 是 在 全 局 环境 下 的 一 个 子 环境 中 定义 的 。 

另外 一 种 通信 方式 是 使 用 参数 。ALGOL60 使 用 按 值 调用 和 按 名 调用 。 在 按 值 调用 下 ， 将 过 
程 的 形式 参数 被 处 理 为 初始 值 为 实 参 值 的 局 部 变量 。 在 按 名 调用 下 ,形式 参数 被 看 成 是 程序 中 
的 一 个 位 置 占 位 符 ， 形 式 参数 的 每 一 个 出 现 将 被 实 参 替换 。 为 了 简化 起 见 ， 不 使 用 ALGOL60 的 
机 制 ， 而 是 采用 按 引 用 调用 的 机 制 。 在 该 机 制 下 ， 参 数 作为 指向 实际 参数 的 指针 传递 。 如 果实 际 
参数 是 一 个 表达 式 (可 能 是 常数 ) ， 则 对 应 的 形式 参数 可 处 理 为 初始 值 为 表达 式 值 的 局 部 变量 。 
在 RAM 和 RASP 中 函数 或 过 程 调 用 的 代价 是 执行 过 程 定 义 体 中 的 语句 的 代价 总 和 。 第 2 章 将 讨 
论调 用 其 他 过 程 (包括 自身 调用 ) 的 执行 代价 。 

9. read 语句 和 write 语句 的 执行 代价 是 明显 的 。read 语句 的 代价 为 1。write 语句 的 代价 是 
是 1 加 上 对 关键 字 write 后 面 的 表达 式 求 值 的 代价 。 

10. comment 语句 允许 在 程序 中 插入 有 助 于 程序 理解 的 注解 ， 其 代价 为 0 

11. 除了 通常 程序 设计 语言 的 语句 外 ， 还 包括 一 些 “ 其 他 形式 ”的 语句 ， 与 等 价 的 程序 语言 语 
名 序列 相 比 ， 这 些 语句 可 提高 算法 的 易 读 性 。 这 些 语句 通常 在 实现 细节 与 算法 无 关 、 实 现 细 节 明 
显 或 需要 高 层次 的 描述 时 使 用 。 通 常 使 用 的 其 他 形式 的 语句 的 例子 包括 : 

a) a 是 集合 S 中 的 最 小 元 素 ; 

5) 标 记 元 素 a 为 “ 旧 的 ”” 

c) 不 失 一 般 性 (wig) 假 定 … 否 则 …n 语句 

例如 ， 

wlg assume a x: b otherwise interchange c and d in statement 

意思 是 ， 如 果 a<b， 则 直接 执行 后 续 的 语句 ;如 果 a >b， 则 在 后 续 的 语句 执行 过 程 中 c 和 d 
的 角色 互 换 。 

使 用 通常 的 程序 设计 语言 语句 或 RAM 代码 实现 这 些 语句 直接 而 乏味 。 这 些 语句 的 执行 代价 
依赖 于 语句 所 在 的 上 下 文 。 在 本 书 的 简化 ALGOL 程序 中 可 以 找到 采用 这 种 类 型 的 语句 的 实例 。 

因为 通常 不 对 变量 进行 说 明 ， 所 以 这 里 将 介绍 一 下 关于 变量 作用 域 的 使 用 惯例 。 在 一 个 给 
定 的 程序 或 过 程 中 ,不 同 的 变量 不 使 用 同一 个 名 字 。 因 此 ， 可 以 将 变量 的 作用 域 看 作 是 变量 出 现 
在 其 中 的 整个 过 程 或 程序 .重要 的 例外 是 可 能 存在 一 个 共用 的 数据 块 ， 有 几 个 过 程 共同 对 其 操 


O 可 假定 有 一 个 数组 STATUS， 若 a 是“ 旧 的 "， 则 STATUS[e] 值 为 1， 否 则 为 0。 
O 有 一 些 不 重要 的 例外 。 例 如 ， 一 个 过 程 可 能 有 两 个 非典 套 的 for 语句 ， 都 使 用 索引 变量 ;。 严 格 地 讲 ，for 语句 
的 索引 变量 的 作用 域 是 该 for 语句 本 身 ， 因 此 i 其实 是 两 个 不 同 的 变量 。 
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作 。 在 这 种 情况 下 ， 可 假定 共用 数据 块 中 的 变量 是 全 局 的 ， 在 操作 时 过 程 使 用 的 临时 存储 可 假定 
是 局 部 于 过 程 的 变量 。 对 变量 的 作用 域 可 能 产生 冲突 的 情况 ， 本 书 将 给 出 明确 的 说 明 。 


习题 


1.1 如 果 a) 对 于 a>0 SINISTRE n, Afnan) ze 
b) 存 在 常数 c > 0，c 20, 对 于 几乎 所 有 的 n>0, A g(n) &cef(n) +c, 证 明 g(n) 是 
O(f( n) ) 的 。 

1.2 如 果 存 在 正 的 常数 c， 对 所 有 的 m， 有 (nan)sc(nz)， 则 记 /(n)s4g(na)。 证 明 若 上 Sg, 
hg, MWA sante 关系 4 还 有 什么 其 他 的 性 质 吗 ? 

1.3 ”编写 完成 下 述 任务 的 RAM, RASP 和 简化 ALCOL 语言 程序 : 
a) & ES A n, 计算 nl!; 
b) 读 入 以 结束 符 (0) 结 尾 的 = 个 正 整数 ， 打 印 这 = 个 整数 的 排序 结果 ; 
c) 接 受 所 有 型 为 1"2"0 的 输入 。 

1.4 对 (a) 统 一 代价 和 (b) 对 数 代价 ， 分 析 你 所 给 出 的 针对 习题 1. 3 的 答案 的 时 间 复 杂 度 和 空间 
复杂 度 。 说 明 对 输入 “规模 ”的 衡量 。 

*1.5 编写 计算 "的 统一 代价 时 间 复 杂 度 为 0(logn) 的 RAM 程序 并 证 明 其 正确 性 。 

*1.6 证 明 对 数 代 价 时 间 复 杂 度 为 T(n) 的 RAM 程序 ， 都 存在 一 个 等 价 的 时 间 复 杂 度 为 
OCT (n) ) 的 无 MULT 或 DIV 指令 的 RAM 程序 。[ 提 示 : 使 用 偶数 编号 的 寄存 器 作为 工作 
存储 器 的 子 例 程 来 仿真 MULT 和 DIV 指令 。 对 于 MULT 指令 , 说 明 : WMRi RM, WAY 
计算 每 个 1()) 部 分 积 ， 然 后 在 OG) ) 步 内 将 它们 加 起 来 ， 其 中 每 步 需 要 Oi) ) 时 间 。] 

*1.7 如 果 将 MULT 和 ADD 从 指令 集中 移 去 ，RAM 或 RASP 的 计算 能 力 会 发 生 什么 变化 ? 对 于 计 
算 代价 的 影响 又 如 何 ? 

**1.8 说 明 任何 可 被 RAM 接受 的 语言 也 可 被 无 间接 寻 址 指令 的 RAM 所 接受 。[ 提示 : 说 明 一 整 

条 图 灵机 带 可 以 编码 为 单一 的 整数 。 由 此 ， 任 意 的 TM 都 可 以 使 用 有 限 个 RAM 的 寄存 器 进 
行 仿真 。] 

1.9 证 明 在 一 个 常数 因子 范围 内 ，RAM 和 RASP 对 于 (a) 统 一 代价 和 (b) 对 数 代价 ， 空 间 复杂 度 
是 等 价 的 。 

1.10 ”给 定 9 个 标量 元 素 作为 输入 ， 编 写 计 算 一 个 3 x3 行列 式 的 直线 状 程序 。 

1.11 编写 一 个 位 操作 的 序列 以 计算 两 个 2 位 整数 的 乘积 。 

1.12 说 明 直 线 状 模 型 下 任何 由 二 进 制 输入 和 布尔 运算 符 组 成 的 个 语句 所 计算 的 函数 集合 丝 可 
由 包含 mn 个 布尔 电路 元 件 的 组 合 逻辑 电路 实现 。 

1.13 说 明 任何 布尔 函数 名 可 由 直线 状 程序 计算 。 

*#1. 14 ”假定 用 位 向 量 v. 的 集合 来 表示 一 个 有 个 顶点 的 图 ， 当 有 生 仅 当 从 顶点 i 到 顶点 j 有 一 条 边 ， 
v, 的 第 j 个 分 量 为 1。 给 出 一 个 O06y(n) 算 法 ， 其 计算 结果 是 向 量 p,， 当 且 仅 当 顶 点 1 到 顶 
点 j 之 间 存在 一 条 路径 ， 其 第 j 个 分 量 的 值 为 1。 可 以 使 用 的 操作 是 对 位 向 量 进行 运算 的 
按 位 逻辑 指令 ， 算 术 指 令 ( 对 具有 “整数 类 型 ”的 变量 ) ， 将 向 量 的 某 位 设置 为 0 或 1 的 指 
令 ， 和 一 条 特殊 的 指令 (其 含义 为 ， 如 果 向 量 v 的 最 左边 的 1 位 于 第 /个 位 置 ， 则 将 / 赋值 
给 整 型 变量 c， 如 果 v 的 所 有 分 量 都 是 0， 则 令 a =0)。 

*115 给 出 一 台 图 灵机 ， 当 给 定 的 两 个 二 进 制 整 数 分 别 位 于 带 1 和 带 2 时 ， 在 带 3 上 打印 它们 的 
和 。 可 以 假定 带 的 最 左 端 放置 了 特殊 符号 #。 

1.16 对 于 如 图 1-21 所 示 的 图 灵机 ， 当 输入 分 别 为 a)0010 和 b)01110 时 ， 给 出 格局 的 变化 
序列 。 
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*1.17. 给 出 一 台 完 成 如 下 工作 的 图 灵机 : 
a) 当 带 1 上 以 0" 开始 时 ， 在 带 2 上 打印 0" 。 
b) 接受 型 为 0"10" 的 输入 。 
1.18 给 出 TM 的 状态 集 和 下 一 移动 函数 ， 仿 真 定 理 1. 3 的 证 明 中 的 RAM 指令 LOADS, 
1.19 给 出 时 间 复 杂 度 为 0(n) 的 RAM 算法 ， 对 于 n, 计算 2”。 程 序 的 (a) 统 一 代价 和 (b) 对 数 
代价 为 何 ? 
*1.20 ”给 定 g(0, n) = Hig(m, n) 227", m»0, sg X PRI g(m, n) AIBXET AGE n, 
计算 g(n, n) f] RAM 程序 。 比较 其 统一 代价 和 对 数 代价 复杂 度 。 
1.21 使 用 实 参 ; 和 4[ 订 执行 1.8 WAR INTERCHANGE, ， 分 别 按 名 调用 、 按 引用 调用 ， 结 果 
一 样 吗 ? 


研究 性 问题 


1.22 图 灵机 是 否 能 对 定理 1.3 所 阐述 的 在 O(T (n) ) 的 时 间 上 界 内 模拟 RAM 计算 的 结果 进行 
改进 ? l 


文献 及 注释 


Shepherdson 和 Sturgis[ 1963], Elgot 和 Robinson[ 1964 ] 以 及 Hartmanis [ 1971 ] 都 对 RAM 和 
RASP 模型 进行 形式 化 的 论述 。 本 书 给 出 的 与 RAM 和 RAS 有 关 的 大 多 数 结果 来 自 Cook 和 Reck- 
how[ 1973 ] 的 专利 。 

图 灵机 理论 可 参见 Turing[1936]。 更 多 概念 细节 可 参阅 Minsky[ 1967 ] 或 Hopcroft 与 Ullman 
[1969], ,也 是 习题 1. 8 的 答案 参考 。 图 灵机 的 时 间 复 杂 度 最 早 的 研究 文献 有 Hartmanis 和 Stearns 
[1965 ] ， 关 于 空间 复杂 度 的 有 Hartmanis, Lewis 和 Stearns[ 1965 ] 以 及 Lewis, Stearns 和 Hartmanis 
[1965]。 计 算 复 杂 性 的 抽象 研究 开始 于 Blum[ 1967 ] 。 综 述 文献 可 参见 Hartmanis 和 Hopcroft 
[1971] 以 及 Borodin[ 1973a] 。 

Rabin[ 1972] 给 出 了 计算 的 决策 树 模型 的 有 趣 扩充 。 


第 2 章 ， 有 效 算法 的 设计 


本 章 目 的 有 两 个 。 首 先 ， 介 绍 一 些 基 本 的 、 对 许多 问题 有 效 算法 的 设计 是 非常 有 用 的 数据 
结构 。 其 次 ， 介 绍 一 些 在 许多 有 效 算 法 中 很 常见 的 “程序 设计 ”技术 ， 例 如 递归 和 动态 规划 等 。 

第 1 章 考 虑 的 是 基本 计算 模型 ， 虽 然 本 书 基于 的 模型 是 RAM， 但 一 般 不 会 根据 其 基本 设备 
描述 算法 。 因 此 ， 还 介绍 了 简化 ALGOL 语言 (1.8 节 ) 。 然 而 这 种 语言 较 简单 ， 还 需要 引入 比 数 
组 更 复杂 的 数据 结构 。 本 章 首先 介绍 一 些 基本 的 数据 结构 ， 如 读者 熟悉 的 在 有 效 的 算法 中 经 常 
用 到 的 表 和 堆栈 等 。 本 章 将 讨论 如 何 使 用 这 些 结构 来 表示 集合 、 图 和 树 。 处 理 表 的 过 程 很 简单 ， 
不 熟悉 的 读者 可 查阅 本 章 后 面 的 基本 参考 资料 ， 或 者 留意 一 下 课 后 习题 。 

本 章 也 包括 递归 的 介绍 。 关 于 递归 ， 很 重要 的 一 点 是 它 能 够 使 算法 的 描述 简化 。 虽 然 本 章 
的 例子 很 简单 ， 不 能 充分 说 明 这 一 点 ， 但 是 通过 使 用 递归 可 减少 细节 的 考虑 ， 对 简明 扼要 地 阐述 
后 面 章节 涉及 的 一 些 更 复杂 的 算法 是 很 有 用 的 。 递 归 本 身 并 不 一 定 使 算法 更 有 效 ， 然 而 ， 当 它 与 
其 他 技术 如 平衡 、 分 治 、 代 数 简 化 等 结合 在 一 起 的 时 候 ， 就 会 看 到 它 常会 使 算法 既 高 效 又 优美 。 


2.1 数据 结构 : 表 、 队 列 和 堆栈 


假设 读者 已 经 熟知 数学 的 基本 概念 如 集合 、 关 系 以 及 基本 数据 类 型 如 整数 、 字 符 串 和 数组 
等 。 这 一 小 节 将 快速 复习 基本 的 表 操 作 。 

从 数学 上 讲 ， 表 是 从 某 个 与 应 用 相关 的 集合 中 所 抽取 的 项 的 有 限 序列 。 算 法 描述 经 常 包 括 
一 个 表 ， 并 对 表 中 的 项 进行 添加 或 者 删除 操作 。 尤 其 是 在 表 中 的 某 个 位 置 添加 或 者 删除 一 项 。 基 
于 这 个 原因 ， 一 般 希望 设计 一 种 表 的 数据 结构 ， 在 其 中 能 够 方便 地 任意 增加 或 者 删除 项 。 

考虑 表 

Item1, Item2, Item3, Item4 (2-1) 
这 个 表 最 简单 的 实现 就 是 使 用 如 图 2-1 所 示 的 单 链 结构 。 结 构 中 每 一 个 元 素 包 括 两 个 存储 
单元 。 第 一 个 存储 单元 包含 项 自身 ”， 第 二 个 存储 单元 包含 指向 下 一 个 元 素 的 指针 。 一 个 可 
能 的 实现 是 使 用 如 图 2-2 中 称 为 NAME 和 NEXT 的 两 个 数组 。 如 果 ELEMENT 是 数组 的 索 
5|, 那么 NAME[ ELEMENT] 就 是 存储 的 项 。 如 果 有 下 一 个 表 项 的 话 ，NEXT[ ELEMENT] 就 
是 表 中 下 一 个 项 的 索引 。 如 果 ，ELEMENT 是 表 中 最 后 一 个 表 项 的 索引 ， 那 么 NEXT[ ELE- 


MENT] =0。 


图 2-1 链表 


如 果 项 自身 是 一 个 复杂 的 结构 ， 那 么 第 一 个 存储 单元 可 能 包含 一 个 指向 该 结构 的 指针 。 

一 个 可 选 的 (或 等 价 的 ) 观点 是 每 一 个 元 素 有 一 个 “单元 ” 。 每 个 单元 有 一 个 “地 址 ”， 该 地 址 存储 在 为 该 元 素 所 
保留 的 一 组 寄存 器 中 的 第 一 个 (可 能 是 仅 有 的 ) 寄存 器 中 。 在 每 个 单元 中 有 一 个 或 多 个 “ 域 " 。 这 里 域 是 NAME 
和 NEXT, NAME[ ELEMENT] 和 NEXTLELEMENT] 用 来 表示 单元 中 域 的 内 容 ， 其 中 单元 的 地 址 是 ELEMENT, 
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2-2 用 NEXT[0] 作 为 总 是 指向 表 的 第 一 个 元 素 的 指针 。 注 意 ， 项 在 数组 NAME 中 的 顺序 
与 它们 在 表 中 的 顺序 并 不 相同 。 然 而 ， 图 2-2 是 图 2-1 的 忠实 的 表示 ， 因 为 NEXT 数组 序列 将 项 
按 它们 在 表 (2-1) 中 的 顺序 排列 。 

接 下 来 要 考虑 的 过 程 是 将 一 个 元 素 插 入 一 个 表 中 。 假 设 FREE 是 数组 NAME 和 NEXT 中 未 用 
单元 的 索引 ，POSITION 是 表 中 某 元 素 的 索引 ，ITEM 要 插 人 到 表 中 该 元 素 的 后 面 。 


procedure INSERT(ITEM, FREE, POSITION): 


in 
NAME[FREE] + ITEM; 
NEXT[FREE] — NEXT[POSITION]; 
NEXT[POSITION] +- FREE 


end 


任何 合理 的 到 RAM 代码 的 翻译 会 将 INSERT 操作 的 执行 代价 的 结果 时 间 ， 该 执行 时 间 与 表 
的 大 小 无 关 。 
例 2.1 假设 希望 在 表 (2-1) 的 Hem2 后 面 插入 一 项 Newitem 以 创建 表 
Iteml , Item2, Newitem, Item3, Item4 
如 果 图 2-2 中 每 个 数组 的 存储 单元 5 都 为 空 ， 可 以 通过 调用 INSERT(Newitem, 5, 3) #£Item2 
(位 置 是 3) 的 后 面 插入 Newitem。INSERT 的 三 个 语句 将 NAME[5] BEDS Newitem, NEXT[5] BR 
值 为 4，NEXT[3] 赋 值 为 5， 如 此 建立 如 图 2-3 所 示 的 数组 。 口 





2-2 有 四 个 项 的 表 的 表示 图 2-3 插入 Newitem 后 的 表 


为 了 删除 在 存储 单元 1 后 的 元 素 ， 可 设置 NEXT[ 站 等 于 NEXT[ NEXT] ] 。 如 果 删 除 成 功 ， 
删除 元 素 的 索引 将 放置 在 未 用 的 存储 单元 表 中 。 

同一 个 数组 常会 存储 几 个 表 。 一 般 ， 其 中 一 个 表 是 未 用 存储 单元 的 列表 ， 可 把 它 作为 空闲 
列表 。 为 了 添加 一 项 到 表 4， 可 修改 过 程 INSERT， 通 过 删除 空闲 列表 的 第 一 个 单元 得 到 一 个 未 
用 单元 。 从 表 4 删除 一 项 ， 可 将 相应 的 单元 返回 至 空闲 列表 备用 。 

这 种 存储 管理 方法 并 不 是 唯一 可 用 的 方法 ， 但 是 ， 一 旦 决定 从 哪里 添加 或 者 删除 项 ， 这 种 
方法 就 可 以 在 有 限 次 的 操作 内 完成 对 表 实施 添加 和 删除 项 的 操作 。 

其 他 关于 表 的 基本 操作 是 归并 两 个 表 成 为 一 个 表 ， 以 及 它 的 逆 操 作 ， 即 在 某 个 元 素 后 面 将 
其 断 开 成 为 两 个 表 。 归 并 操作 可 通过 增加 另 一 个 指向 表 的 表 指 针 使 操作 在 有 限时 间 内 执行 。 这 
个 指针 给 出 了 表 中 最 后 一 个 元 素 的 索引 ， 从 而 避免 为 了 找到 最 后 一 个 元 素 而 搜索 整个 表 。 如 果 
能 够 在 分 割 之 前 给 出 元 素 的 索引 ， 分 割 操作 的 时 间 可 以 是 有 界 的 。 

通过 增加 一 个 数组 PREVIOUS 能 够 在 两 个 方向 对 表 进行 遍历 。PREVIOUS[ 71] 的 值 是 表 中 位 
置 为 1 的 项 的 前 趋 邻 接 项 的 位 置 。 称 具有 这 种 性 质 的 表 为 双向 链接 。 对 于 双向 链表 ， 不 用 给 出 前 
一 项 的 位 置 ， 就 能 够 删除 或 者 插入 一 项 。 
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有 时 对 表 实 施 的 操作 是 非常 有 限 的 。 例 如 ， 可 能 仅 在 表 尾 添加 或 者 删除 项 。 也 就 是 说 ， 以 
后 进 先 出 的 方式 插入 或 者 删除 项 。 在 这 种 情况 下 ， 一 般 可 称 表 为 堆栈 或 者 压 栈 存储 。 
堆栈 经 常 以 一 维 数组 实现 。 例 如 ， 表 
Iteml , Item2, Item3 NAME 
可 存储 在 如 图 24 所 示 的 数组 NAME rh, TOP 变量 是 一 个 指针 ， 指 向 最 后 9| tem 1 | 
一 个 压 人 堆栈 的 项 。 为 了 给 堆栈 添加 (PUSH ) 新 的 项 ， 可 让 TOP 为 TOP «1, 1 
然后 给 NAME[ TOP] 赋 一 个 新 值 ( 因为 数组 NAME 的 长 度 为 有 限 的 !， 在 插 


TOP 一 2 












人 新 值 前 ， 需 要 确定 TOP <! - 1) 。 要 从 堆栈 的 顶部 删除 (POP) 一 项 ,设置 
TOP TOP - 1 即 可 。 注 意 ， 不 需要 将 项 从 堆栈 物理 性 删除 掉 。 可 以 通过 检 
E TOP 的 值 是 否 小 于 零 来 检测 堆栈 是 否 为 空 。 显 然 ， 执 行 PUSH 和 POP 操 
作 、 测 试 堆栈 是 否 为 空 的 操作 时 间 是 与 堆栈 的 元 素数 目 无 关 的 。 

另 一 个 特别 的 表 形式 是 队列 ， 此 时 表 中 的 项 是 从 一 端 ( 队 头 ) 添加 而 从 
另 一 端 删除 。 和 堆栈 一 样 ， 一 般 使 用 一 维 数组 构造 一 个 队列 。 图 2-5 表示 
包含 表 中 项 P、0、R、S、7 的 队列 。 两 个 指针 分 别 指向 队 头 和 队 尾 。 为 了 
向 队列 添加 (ENQUEUE ) 一 个 新 项 ， 和 堆栈 一 样 ， 可 将 FRONT 设 为 FRONT 
+1， 再 将 新 项 存储 在 NAME[ FRONT]. 。 从 队列 中 移 除 (DEQUEUE ) 一 项 
时 ， 需 要 将 REAR 设置 为 REAR + 1。 注 意 ， 这 种 技术 使 项 的 存 取 以 先进 先 
出 的 方式 进行 。 

因为 数组 NAME 的 长 度 是 有 限 的 即 !/， 指 针 FRONT 和 REAR 最 终 将 到 
达 数 组 的 端点 。 如 果 队 列 所 表示 的 表 的 长 度 不 会 超过 1， 可 以 将 NAME[0] 
处 理 为 NAME[1 -1] 之 后 的 元 素 。 

存储 在 表 中 的 项 本 身 可 以 是 复杂 的 结构 。 例 如 ， 在 操作 一 个 数组 表 
时 ， 不必 实 际 添加 或 者 删除 数组 ， 因 为 每 次 添加 或 者 删除 操作 都 需要 与 数 
组 大 小 成 比例 的 时 间 。 一 般 添加 或 者 删除 指向 数组 的 指针 即 可 。 由 此 可 图 25 队列 的 一 维 
见 ， 一 般 可 以 在 固定 的 时 间 内 添加 或 者 删除 一 个 复杂 的 结构 ， 所 花费 的 时 数组 实现 
间 与 这 个 结构 的 大 小 无 关 。 


图 24 堆栈 的 实现 





2.2 集合 的 表示 


表 通 常用 来 表示 集合 。 在 这 种 表示 法 下 ， 表 示 集 合 所 需 的 内 存 规模 与 集合 中 元 素 的 个 数 成 
比例 。 执 行 对 集合 的 操作 所 需要 的 时 间 依 赖 于 操作 的 特性 。 例 如 ， 假 设 4 和 B 是 两 个 集合 ， 
IE AQ B 需要 至 少 与 两 个 集合 的 规模 总 和 成 比例 的 时 间 ， 原 因 是 必须 分 别 扫描 表示 4 M B BY 
RAS, 

同样 ， 操 作 4UB 也 至 少 需 要 与 集合 大 小 总 和 成 比例 的 时 间 ， 原 因 是 必须 查找 出 现在 两 个 集 
合 中 的 相同 元 素 ， 并 且 删 掉 其 中 之 一 。 然 而 ， 如 果 4 和 B 没有 交集 ,可 简单 地 合并 两 个 表示 A 
MBR, IR AUB 操作 的 时 间 是 与 4 和 8B 的 大 小 无 关 的 。 如 果 需 要 一 种 快速 的 方法 确定 给 定 
的 元 素 是 否 在 给 定 集合 中 出 现 ， 不 相交 的 集合 的 合并 问题 将 会 变 得 更 加 复杂 。4. 6 和 4.7 节 将 更 
全 面 地 讨论 这 个 问题 。 

除了 表 ， 另 一 种 表示 集合 的 方法 是 使 用 位 向 量 。 假 设 所 讨论 的 域 为 UC 所 有 的 集合 都 是 它 的 
FR), CA 个 成 员 。 先 线性 排列 U 中 的 元 素 。 子 集 SGCU 可 表示 为 一 个 n 位 的 向 量 v,， 当 且 
仅 当 上 U 中 第 i 个 元 素 是 5 的 元 素 时 ，v, 中 的 第 i 位 为 1。 一 般 称 v, 是 5 的 特征 向 量 。 





O ”如 果 两 个 表 有 序 ， 那么 存在 一 个 找到 它们 的 交 的 线性 时 间 算 法 。 
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位 向 量 表示 法 具有 在 确定 U 的 第 i 个 元 素 是 否 属于 一 个 集合 的 操作 时 间 与 集合 大 小 无 关 的 优 
Ao WB, 集合 的 基本 操作 如 并 和 交 能 够 通过 位 向 量 的 V 和 人 操作 来 执行 。 

如 果 不 认为 位 向 量 操作 是 基本 的 (需要 一 个 单位 时 间 ) 运 算 ， 那么 可 通过 定义 一 个 数组 4 来 
获得 特征 向 量 的 效果 ， 当 且 仅 当局 的 第 i TIRES SHH, ALi) =1。 在 这 种 表示 方法 下 ， 
确定 一 个 元 素 是 否 一 个 集合 的 成 员 是 很 简单 的 。 它 的 缺点 是 交 和 并 操作 需要 的 时 间 是 与 1019 
成 比例 的 ， 而 不 是 与 操作 所 涉及 的 集合 大 小 成 比例 。 类 似 地 ， 存 储 集 合 S 的 空间 也 与 171 ,而 
不 是 与 151 成 比例 。 


2.3 


现在 介绍 图 的 数学 表示 和 常用 的 表示 图 的 数据 结构 。 

定义 ”一 个 图 G=(V, EF) 包括 一 个 有 限 非 空 的 顶点 集 V， 和 一 组 边 的 集合 。 如 果 边 是 顶点 
的 有 序 对 (v，w) ， 那 么 称 这 个 图 为 有 向 的 ,ov 称 为 边 (y，z) NUR, w 为 边 (v,，w) 的 头 。 如 果 边 
是 由 不 同 的 无 序 顶点 对 (集合 ) 组 成 ， 也 表示 为 (v,w) ， 此 时 称 图 为 无 向 的 。9 

在 一 个 有 向 图 G=(V, E)rp, MR, w) 是 E 中 的 一 条 边 ， 那 么 顶点 w 与 顶点 ov 邻接。 边 
(v, w) 从 5 到 w。 称 5 的 邻接 点 的 数量 为 的 (出 ) 度 。 

在 一 个 无 向 图 G=(V, EF) 中 ,如果 (v,w) 是 E 中 的 一 条 边 ， 则 (w, v) = (v, w)， 即 (w， 
v) 和 (v，w) 是 同一 条 边 。 如 果 (v,w)[ 因此 (w, v) 也 ] 属 于 EE， 则 说 w 与 ov 邻接。 顶点 的 度 就 是 
与 它 邻 接 的 顶点 数量 。 

有 向 图 或 无 向 图 中 的 路 径 是 边 (v4 外 ) ，(， 妃 ) ocn. (vus, o, ) 的 序列 。 从 vv 到 [的 
路径 长 度 为 n - 1。 通常 ， 路 径 也 可 用 路 径 上 的 顶点 序列 o, n, =, o AER. IER 
例 ， 单 个 顶点 的 路 径 即 从 顶点 到 自身 的 路 径 ， 长 度 为 0。 如 果 除 了 第 一 个 和 最 后 一 个 顶点 可 
能 相同 外 ， 路 径 中 所 有 的 边 和 顶点 都 不 相同 ， 则 路 径 称 为 是 简单 路 径 。 环 路 是 一 个 路 径 长 
度 至 少 为 1 的 简单 路 径 ， 它 的 起 始 和 终止 都 在 同一 个 顶点 。 注 意 ， 在 无 向 图 中 ， 环 路 的 长 
度 至 少 为 3。 

有 几 种 常用 的 表示 图 G =(V,，E) 的 方法 。 其 中 之 一 是 邻接 珑 阵 ， RIVI x IVE ago M1 5m 
阵 4。 在 这 个 矩 阵 中 ， 当 且 仅 当 从 顶点 i 到 顶点 /有 一 条 边 时 ，4 ABBY TOO ALI, 门 为 1。 在 经 
常 需 要 查询 某 些 边 是 否 存在 的 图 算法 中 ， 图 的 邻接 算 阵 表示 法 是 很 方便 的 ， 因 为 需要 确定 一 条 
边 是 否 存 在 的 时 间 与 1V1 和 151 的 大 小 无 关 ， 是 固定 的 。 使 用 邻接 矩阵 的 主要 缺点 是 ， 即 使 图 
只 有 0( 1V1 ) 条 边 ， 仍 需要 qv | 的 存储 空间 。 而 简单 直接 地 对 邻接 矩阵 进行 初始 化 的 操作 也 需 
BO WD) HA, 这 使 得 对 只 有 0( 上 V1 ) 条 边 的 图 进行 操作 时 ， 算 法 的 时 间 复 杂 度 仍 需 
OC IV ) 。 虽 然 存 在 解决 这 个 问题 的 方法 ， 但 总 会 有 其 他 问题 出 现 ( 见 练习 题 2. 12) ， 使 得 基于 邻 
接 和 矩阵 的 时 间 复杂 度 为 度 为 0( UV E 的 算法 很 少 。 

一 个 有 趣 的 选择 是 用 位 向 量 来 表示 邻接 矩阵 的 行 和 /或 列 。 这 种 表示 法 可 以 使 图 算法 有 相当 
的 效率 。 

另 一 个 可 能 的 图 的 表示 法 是 通过 表 的 方式 。 顶 点 v 的 邻接 表 是 一 个 包括 所 有 与 v 邻接 的 顶点 
w 的 表 。 一 个 图 能 用 上 V | 个 邻接 表 表 示 ， 每 个 顶点 用 一 个 表 。 

例 2.2 图 2-6a 表示 有 4 个 顶点 的 有 向 图 。 图 2-6b 是 相应 的 邻接 矩阵。 图 2-6c 表示 4 个 邻 
接 表 ， 每 个 顶点 一 个 表 。 例 如 ， 由 于 存在 着 从 顶点 1 到 顶点 2 和 顶点 4 的 边 ， 因 此 顶点 1 的 邻接 
表 中 有 元 素 2 M4, 它们 以 图 2-1 的 形式 链接 到 一 起 。 


O 本 书 用 1 X 【表示 集合 X( 大 小 或 容量 ) 中 元 素 的 数量 。 
© 注意 ，(a，a) 可 能 是 有 向 图 而 不 是 无 向 图 的 边 。 
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b) 邻接 矩阵 
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c) 邻接 表 D 邻接 表 的 表格 表示 法 
图 26 有 向 图 和 它 的 表示 方法 


图 2-6d 是 邻接 表 的 表格 表示 法 。NEXT 数组 的 前 4 个 存储 单元 存储 着 指向 邻接 表 第 一 个 项 点 的 
指针 ， 即 NEXT[ 引 指向 顶点 i 的 邻接 表 的 第 一 个 顶点 。 注 意 ， 由 于 没有 顶点 在 顶点 3 的 邻接 表 上 ， 
所 以 NEXT[3] =0。 数 组 NEXT 的 剩 下 部 分 表示 图 的 边 。 数 组 HEAD 包含 邻接 表 中 的 顶点 。 这 样 ， 
申 于 NEXT[1] =5, 顶点 1 的 邻接 表 从 存储 单元 5 开始 。HEAD[5] =2 表示 有 一 条 边 (1，2)。 
NEXT[5] =6 和 HEAD[6] =4 表示 边 (1，4)。NEXT[6] =0 表示 没有 其 他 以 1 为 尾 的 边 了 。 口 

注意 ， 用 邻接 表 表 示 图 时 ， 需 要 的 存储 空间 与 |y| + EL 成 比例 。 当 [E] << Iv pnm, 常 
用 邻接 表 表 示 法 。 

如 果 图 是 无 向 的 ， 那 么 每 条 边 (v，w) 都 会 表示 两 次 ,一 次 是 在 。 的 邻接 表 中 ， 另 一 次 是 在 w 
的 邻接 表 中 。 在 这 种 情况 下 ， 可 能 会 增加 一 个 LINK 数组 使 无 向 图 的 副本 间 相 互 关联 。 这 样 ， 如 
果 i 是 顶点 w 在 顶点 v 的 邻接 表 中 的 位 置 ，LINK[ i] 就 是 顶点 "在 顶点 w 的 邻接 表 中 的 位 置 。 

要 方便 地 从 无 向 图 中 删除 边 ， 可 使 用 双向 链接 邻接 表 。 这 通常 是 必需 的 ， 因 为 即使 删除 边 
(v，w) 是 顶点 4 的 邻接 表 上 的 第 一 条 边 ， 反 方向 的 边 可 能 会 出 现在 顶点 w 的 邻接 表 的 中 间 。 为 
了 快速 地 从 顶点 w 的 邻接 表 中 删除 边 (v，w) ， 必 须 能 够 迅速 地 在 这 个 邻接 表 中 找到 它 的 前 一 条 
边 的 位 置 。 


2.4 树 


接 下 来 介绍 一 种 非常 重要 的 有 向 图 一 一 树 ， 还 要 考虑 适当 表示 它 的 数据 结构 。 


定义 称 没 有 环 路 的 有 向 图 为 有 向 无 环 图 。( 有 向 ) 树 (有 时 称 为 根 树 ) 是 一 个 满足 下 列 性 质 
的 有 向 无 环 图 : 
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L 恰好 只 有 一 个 顶点 没有 边 进 入 ， 该 顶点 称 为 根 ; 

2. 除了 根 ， 每 个 点 都 怡 好 有 一 人 边 ; 

3. 根 到 每 个 顶点 都 有 一 条 路 径 ( 显然 这 条 路 径 是 唯一 的 ) 。 

一 个 有 向 图 若是 一 些 树 的 集合 ， 则 称 为 森林 。 森 林 和 树 是 有 向 无 环 图 的 特殊 情况 ， 它 们 出 
现 是 非常 频繁 的 。 下 面 是 一 些 相关 的 术语 。 

定义 WEFZ(V, EE) 是 森林 的 图 。 如 果 (v, w)dE E P, BR vw 的 父亲 , w Ev HILF, 
如 果 有 一 条 从 ov 到 ww 的 路 径 ， 那 么 称 v 是 ww 的 祖先 ，w 是 bv 的 后 代 。 若 vw， 那 么 称 b 是 w 的 严 
HAR, w 是 ov 的 严格 后 代 。 一 个 没有 严格 后 代 的 顶点 叫做 树叶 。 顶 点 v 和 它 所 有 的 后 代 叫 做 下 
的 子 树 。 顶 点 v 叫 做 子 树 的 根 。 

树 中 顶点 & 的 深度 是 从 根 到 4b 的 路 径 长 度 。 树 中 顶点 vo 的 高 度 是 从 v 到 树叶 的 最 长 路 径 的 长 
度 。 树 的 高 度 是 根 的 高 度 。 顶 点 "在 树 中 的 层 数 是 指 树 的 高 度 减 去 " 的 深度 。 例 如 ， 在 图 2-7a 
中 ， 顶 点 3 的 深度 是 2， 高 度 为 0， 层 数 为 1。 


LEFTSON RIGHTSON 





a) b) 
图 2-7 二叉树 和 它 的 表示 方法 


有 序 树 是 一 棵 项 点 的 儿子 间 有 序 的 树 。 画 有 序 树 时 ， 假 设 每 一 个 顶点 的 儿子 是 由 左 向 右 排 
序 的 。 二 又 树 是 如 下 定义 的 有 序 树 ， 

1. 顶点 的 每 个 儿子 都 明确 是 左 儿 子 或 者 右 儿 子 ; 

2. 没有 顶点 有 多 于 一 个 左 儿子 或 多 于 一 个 右 儿子 。 

以 顶点 v 的 左 儿 子 为 根 的 子 树 T 如果 存在 ) 称 为 v 的 左 子 树 。 类 似 ， 以 顶点 v 的 右 儿 子 为 根 - 
的 子 树 也 (如 果 存 在 ) 称 为 的 右 子 树 。 了 7 中 的 所 有 顶点 均 在 也 中 所 有 顶点 的 左边 。 

二 叉 树 常用 两 个 数组 LEFTSON 和 RIGHTSON 表示 。 若 二 叉 树 的 顶点 用 从 1 Bn 的 整数 表示 ， 
那么 ， 当 且 仪 当 j 是 i 的 左 儿 子 时 ，LEFTSON[i] 2j, WE i 没有 左 儿 子 ， 那么 LEFTSON[ i] =0。 
RIGHTSON[ 引 可 以 类 似 定义 。 

例 2.3 图 2-7a、b 给 出 一 棵 二 叉 树 和 它 的 表示 。 口 

定义 ”对 于 某 个 整数 上 ， 若 每 个 深度 均 小 于 上 的 顶点 既 有 左 儿 子 又 有 右 儿 子 ， 而 每 个 深 
度 为 的 顶点 都 是 树叶 ， 则 称 这 个 二 叉 树 是 完全 的 。 高 度 为 上 的 完全 二 叉 树 恰 有 2*! -1 个 
顶点 。 

一 个 高 度 为 下 的 完全 二 叉 树 通常 可 用 单个 数组 表示 。 数 组 的 第 一 个 位 置 包含 树 根 。 位 置 ; 的 
顶点 的 左 儿子 位 于 位 置 2;， 右 儿子 位 于 位 置 2 + 1。 假如 一 个 顶点 在 位 置 i >1， 则 它 的 父亲 的 位 
Bir 2]. 
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许多 涉及 树 的 算法 经 常 以 某 种 顺序 遍历 树 ( 访 问 树 的 每 个 顶点 ) 。 存 在 闭 几 种 系统 的 遍历 方 
三 种 常用 的 是 前 序 、 后 序 和 中 序 。 

定义 设 了 为 一 棵 树 ， 有 根 r REILF »,, vy, Uks kz0, 在 k=0 的 情况 下 ， 树 只 有 一 
个 顶点 To 


x 


o 


了 的 前 序 遍 历 如 下 递归 地 定义 : 

1. 访问 根 ro 

2. 以 前 序 依 次 访问 根 为 ww ovs, v AFR. 
和 的 后 序 遍历 如 下 递归 地 定义 : 

1. 以 后 序 依 次 访问 根 为 v, ，v,，… ,vv 的 子 树 。 
2. WPR ro 


对 于 二 叉 树 ， 中 序 遍 历 如 下 递归 地 定义 : 

1. 以 中 序 访问 根 r 的 左 子 树 ( 如 果 存 在 的 话 ) 。 

2. 访问 r。 

3. 以 中 序 访 问 > 的 右 子 树 ( 如果 存在 的 话 ) 。 

例 2.4 图 2-8 表示 一 棵 二 叉 树 ， 顶 点 以 前 序 (图 2-8a) 、 后 序 ( 图 2-8b) 和 中 序 ( 图 2-8c) 的 
顺序 进行 标记 。 口 


(3) (8) 
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a 前 序 b) 后 序 o p 
图 2-8 树 的 遍历 


一 旦 通过 遍历 给 顶点 指派 了 标号 ， 那 么 ， 通 过 标号 查 到 顶点 是 很 方便 的 。 因 此 ， t 
可 用 顶点 的 标号 vz 来 表示 该 顶点 。 若 以 访问 顺序 来 标号 顶点 ， 那 么 标号 就 有 一 些 有 趣 的 
性 质 。 

在 前 序 中 ， 以 7 为 根 的 子 树 的 所 有 顶点 的 标号 不 会 比 r 小 。 更 准确 地 说 ， 如 果 D, 是 r 的 后 代 
集合 ， 那 么 ， 当 且 仅 当 r<v<r+ ID] Bf, v 在 D, 中 。 通 过 将 每 个 顶点 4 与 前 序 标号 和 后 代 的 数 
目 联系 起 来 ， 可 以 很 容易 地 确定 顶点 w EF v 的 后 代 。 在 初始 指派 前 序 标号 并 计算 每 个 顶点 的 后 
代 的 数目 后 ，w ES o 的 后 代 的 问题 能 够 在 固定 时 间 内 回答 ， 与 树 的 大 小 无 关 。 后 序 标号 也 有 类 
似 的 性 质 。 

二 叉 树 的 中 序 标号 的 性 质 是 顶点 "的 左 子 树 的 每 个 顶点 的 标号 比 " 小 ， 而 且 v 的 右 子 树 的 每 
个 顶点 的 标号 比 v 大 。 因 此 ， 为 了 找到 顶点 w， 将 w ERR METH, WME wr, KA w CBR 
到 。 如 果 w <r， 在 左 子 树 重复 这 个 过 程 ; 如 果 w > r， 在 右 子 树 重复 这 个 过 程 。 最 终 将 找到 w, 
遍历 的 这 个 特性 将 用 在 后 面 的 章节 中 。 

下 面 是 关于 树 的 最 终 定义 。 

定义 无 向 树 是 一 个 连通 (任意 两 个 顶点 之 间 存 在 通路 ) 、 无 环 的 无 向 图 。 有 根 无 向 树 是 电 
式 指派 一 个 顶点 为 根 的 无 向 树 。 
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简单 地 使 有 向 树 的 所 有 边 变 为 无 向 ， 就 可 以 使 有 向 树 转化 为 一 棵 无 向 有 根 树 。 对 于 无 向 有 
根 树 ， 可 使 用 与 有 向 树 相同 的 术语 和 表示 习惯 。 基 本 的 数学 上 的 差别 是 : 在 有 向 树 中 所 有 的 路 径 
都 是 从 祖先 到 后 代 ， 而 在 无 向 有 根 树 中 ， 路 径 是 双方 向 的 。 


2.5 递归 


一 个 直接 或 间接 调用 自身 的 过 程 叫 做 递归 。 跟 非 递归 相 比 ， 使 用 递归 可 以 尽 可 能 
简明 地 描述 算法 。 这 一 节 将 给 出 递归 算法 的 例子 ， 并 勾勒 出 递归 是 怎样 在 RAM ER 
行 的 。 

考虑 2.4 节 中 给 出 的 二 叉 树 的 中 序 遍 历 。 我 们 希望 在 创建 一 个 为 二 叉 树 顶点 分 配 中 序 标号 的 
算法 能 反映 中 序 遍 历 的 定义 。 下 面 给 出 这 样 的 算法 。 注 意 ， 这 个 算法 通过 递归 调用 自身 来 标注 
子 树 。 

算法 2.1 二 叉 树 顶点 的 中 序 标号 。 





和 栓 入 。 用 数组 LEFTSON 和 RIGHTSON 表示 的 procedare INORDER(VERTEX): 
二 叉 树 。 . it LEFTSON[VERTEX] » 0 then 
INORDER(LEFTSON[VERTEX]); 
输出 : RÀ NUMBER 的 数组 ，NUMBER [i . NUMBER[VERTEX] — COUNT; 
. = . COUNT — COUNT + 1; 
是 顶点 i 的 中 序 标号 。 . if RIGHTSON [VERTEX] » 0 then 
Zik: 除了 LEFTSON, RIGHTSON 和 NUM- à INORDER(RIGHTSON[VERTEX]) 
BER ， 算 法 还 使 用 一 个 全 局 变量 COUNT， 它 包含 
要 分 配给 各 顶点 的 中 序 标号 。COUNT 初 值 为 1。 图 2-9 ”中 序 遍 历 的 递归 过 程 
参数 VERTEX 最 初 为 根 。 递 归 调 用 图 2-9 所 示 的 
过 程 。 
算法 本 身 是 : 
begin 
COUNT-—1 ; 
INORDER( ROOT) 
end QO 


使 用 递归 有 几 个 好 处 。 首 先 ， 通 常 递归 程序 更 容易 理解 。 如 果 上 面 的 算法 没有 用 递归 ， 则 
可 能 需要 构建 一 个 显示 的 机 制 来 遍历 树 。 树 中 向 下 的 路 径 是 没有 什么 问题 的 ， 但 是 为 了 有 返回 
祖先 的 能 力 ， 则 需要 在 堆栈 中 存储 祖先 ， 而 且 操作 堆栈 的 语句 将 会 使 得 算法 复杂 化 。 同 一 个 算法 
的 非 递 归 版 本 看 起 来 可 能 如 下 。 

算法 2.2 算法 2.1 的 非 递归 版 本 。 

输入 ; 同 算法 2. 1。 

输出 ， 同 算法 2.1, 

方法 : 在 堆栈 中 存储 从 根 到 当前 被 搜寻 的 顶点 的 路 径 上 所 有 未 被 标记 的 顶点 的 方式 来 遍历 
树 。 在 从 顶点 v S] o 的 左 儿子 的 遍历 过 程 中 ， 将 "存储 在 堆栈 中 。 在 搜索 完 ， 的 左 子 树 后 ， 对 ， 
进行 标记 并 将 其 从 堆栈 中 弹出 。 接 下 来 ， 标 记 ，* 的 右 子 树 。 

在 从 项 点 v 到 它 的 右 儿 子 的 过 程 中 ， 算 法 并 没有 将 "放置 在 堆栈 中 ,这 是 因为 ， 标 记 完 右 子 
树 后 算法 并 不 希望 返回 v， 而 是 返回 到 ，* 的 还 没 标记 的 祖先 (v 的 最 近 的 祖先 w， 此 时 "是 z 的 左 
子 树 ) 。 算 法 如 图 2-10 所 示 。 口 
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COUNT — I; 
VERTEX 二 ROOT; 

STACK < empty; 

left: while LEFTSON [VERTEX] x 0 do 


push VERTEX onto STACK, 
VERTEX «— LEFTSON[VERTEX) 


end; 
center: NUMBER[VERTEX] + COUNT; 
COUNT « COUNT + 1; 
if RIGHTSON[VERTEX] = 0 then 


VERTEX 二 RIGHTSON[VERTEX]; 
gote left 
end; 
if STACK not empty then 
VERTEX < top element of STACK: 
pop STACK; 


goto center 
end 









end 


图 2-10” 非 递归 的 中 序 算法 


通过 归纳 二 叉 树 顶点 的 标号 ， 可 容易 地 验证 递归 方法 是 正确 的 。 类 似 地 可 证 明 非 递归 方法 
也 是 正确 的 ,但 是 归纳 假设 并 不 像 递 归 方 法 那样 透明 ， 需 要 额外 关心 堆栈 操作 以 及 二 叉 树 的 正 
确 遍 历 。 另 一 方面 ， 递 归 可 能 付出 的 代价 是 对 时 间 、 空 间 复 杂 度 的 常数 因子 的 影响 。 

很 自然 有 递归 算法 怎样 翻译 成 RAM 代码 的 问题 。 根 据 定理 1.2, RAM 能 够 最 多 用 惕 常数 因 
子 的 程序 来 模拟 RASP， 因 此 讨论 RAS 的 代码 结构 就 可 以 了 。 这 里 要 讨论 一 种 比较 直接 的 实现 
递归 的 技术 。 这 种 技术 可 以 满足 本 书 中 用 到 的 所 有 程序 ， 但 是 它 并 没有 覆盖 所 有 可 能 出 现 的 
情况 。 

递归 过 程 实现 的 核心 是 堆栈 ， 堆 栈 中 存储 着 每 个 没有 终止 的 过 程 调用 所 使 用 的 数据 。 也 就 
是 说 ， 所 有 非 全 局 数据 都 在 堆栈 中 。 可 将 堆栈 划分 为 堆栈 帧 ， 它 们 是 连贯 的 单元 (寄存 器 ) 块 。 
每 个 过 程 调用 使 用 一 个 堆栈 帧 ， 这 个 堆栈 帧 的 长 度 依赖 于 特定 的 调用 过 程 。 

假设 正在 执行 过 程 4。 堆 栈 将 如 图 2-11 所 示 。 如 果 4 调用 过 程 8， 将 做 如 下 操作 ; 

1. 在 堆栈 的 顶部 放置 一 个 适当 大 小 的 堆栈 帧 。 帧 的 内 部 以 B 知道 的 方式 排列 : 

a) 指 向 调用 B 的 实 参 的 指针 。9 

b) 清 空 用 于 存储 B 的 局 部 变量 的 空间 。 

c) 在 结束 对 B 的 调用 后 ， 应 执行 例 程 4 中 RASP 指令 的 地 址 (返回 地 址 ) 。e 

如 果 B 是 一 个 有 返回 值 的 函数 ， 则 指向 4 堆栈 帧 中 存储 函数 返回 值 的 单元 的 指针 ( 值 的 地 
址 ) 也 放 到 B 的 堆栈 帧 中 。 

2. 控制 权 传 给 互 的 第 一 条 指令 。 任 何 属于 忆 的 参数 值 或 者 局 部 标识 符 的 地 址 都 可 以 通过 索 
引 从 B 的 堆栈 帧 中 找到 。 

3. M B 结束 ， 它 通过 以 下 步 怠 返 回 控制 权 给 A, 

a) 从 栈 顶 获得 返回 地 址 。 

b) 如 果 瑟 是 一 个 函数 ，retam 语句 的 表达 式 部 分 表示 的 值 存 储 在 堆栈 中 为 存放 值 所 规定 的 


O ”如 果实 参 是 一 个 表达 式 ， 则 在 4 的 堆栈 帧 中 计算 它 ， 并 把 指向 这 个 值 的 指针 放置 到 B 的 帧 中 。 如 果实 参 是 一 个 
结构 如 数组 ， 使 用 一 个 指向 该 结构 的 第 一 个 字 的 指针 就 足够 了 。 
O 这 是 一 个 指向 返回 地 址 的 跳 转 ， 这 对 RAM 来 说 是 难以 实施 的 (虽然 完全 有 可 能 ) ， 因 此 使 用 RASP 模型 。 
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单元 中 。 
c) 过 程 8 的 堆栈 帧 从 堆栈 中 弹出 。 这 使 得 为 过 程 4 创建 的 堆栈 帧 位 于 堆栈 的 顶部 。 
d)4 从 返回 地 址 给 出 的 单元 处 继续 执行 。 
a pu 
把 LEFTSON[ VERTEX] 当 作 实 参 调 用 自己 时 ， 它 在 
堆栈 中 与 VERTEX 新 值 的 地 址 共同 存储 的 是 标示 调 
用 结束 的 返回 地 址 ， 即 以 行 2 的 语句 继续 执行 程序 。 
因此 ， 无 论 VERTEX 在 过 程 定 义 的 任何 地 方 出 现 ， 
变量 VERTEX 都 能 高 效 地 替代 为 LEFTSON [ VER- 
t ror- 
在 某 种 意义 上 说 ， 上 述 操作 模拟 了 非 递归 算法 、 
2.2。 然 而 ， 认 识 到 以 RIGHTSON[ VERTEX] 为 实 参 图 2-11 递归 过 程 调用 堆栈 
的 INORDER 调用 的 完成 也 结束 了 调用 过 程 的 执行 。 因 此 ， 当 实 参 是 RICHTSON[ VERTEX ] 的 时 
候 ， 没 有 必要 在 堆栈 中 存储 返回 地 址 或 者 存储 VERTEX。 口 
过 程 调用 所 需 时 间 与 计算 实 参 的 时 间 以 及 在 堆栈 中 存储 指向 值 的 指针 花费 成 比例 。 返 回 语 
名 所 用 的 时 间 肯 定 不 会 超过 这 个 时 间 。 
考虑 递归 过 程 的 集合 花费 的 时 间 ， 通 常 最 简单 的 是 计算 一 个 调用 过 程 的 调用 所 花费 的 时 间 。 
这 样 作为 输入 尺度 的 函数 ， 可 以 限制 每 个 过 程 调 用 花费 的 时 间 ， 这 不 包括 它 调 用 的 过 程 所 花费 
的 时 间 。 可 把 所 有 过 程 调 用 的 限制 时 间 加 起 来 ， 给 出 一 个 总 的 时 间 代价 的 上 限 。 
为 了 计算 递归 算法 的 时 间 复 杂 度 ， 可 使 用 递 推 方程 。 作 为 输入 参数 n HBR, BRT (nr) 
第 i 个 过 程 相 联 系 ， 表 示 第 i 个 过 程 的 执行 时 间 。 通 常 ， 过 程 i 所 调用 的 过 程 的 执行 时 间 可 表示 
为 也 (nm) 的 递 推 方程 。 然 后 ， 求 解 递 推 方程 组 得 到 结果 。 若 程序 只 涉及 一 个 过 程 ， 此 时 T(n) 依 
赖 于 7T(m) 的 值 ， 而 m 属于 小 于 n 的 一 个 有 限 集合 。 下 一 节 将 讨论 经 常 遇 到 的 一 些 递 归 问 题 的 解 
决 方法 。 
记 住 ， 在 这 里 和 任何 其 他 地 方 ， 所 有 的 代价 分 析 都 假设 使 用 统一 代价 函数 。 如 果 使 用 对 数 
代价 函数 ， 用 来 执行 递归 过 程 的 堆栈 长 度 可 能 影响 时 间 复 杂 度 分 析 。 
2.6 分 治 法 
一 个 解决 问题 的 通常 方法 是 将 问题 分 为 几 个 小 的 部 分 ， 找 到 每 部 分 的 解决 方案 ， 然 后 ， 把 
每 部 分 的 解决 方案 结合 起 来 ， 组 成 整体 的 解决 方案 。 尤 其 使 用 递归 时 ， 如 果子 问题 是 原 问题 的 较 
小 的 版 本 ， 这 种 方法 通常 可 以 提供 有 效 的 解决 方案 。 通 过 分 析 递 推 方程 的 结果 ， 下 面 两 个 例子 说 
明了 这 种 技术 。 
考虑 在 包含 ”个 元 素 的 集合 S 中 找到 最 大 元 素 和 最 小 元 素 的 问题 。 为 了 简单 起 见 ， 假 设 n 是 
2 的 矫 。 找 到 最 大 和 最 小 元 素 的 一 种 显而易见 的 方式 是 分 别 找 到 它们 。 例 如 ， 以 下 过 程 在 5 的 元 
素 中 经 过 nm- 1 次 比较 ， 寻 找 $ 中 的 最 大 元 素 。 


MAX < any element in 5; 
for all other elements x in 5 do 
if x > MAX then MAX < x 
end 


类 似 地 ， 能 够 用 n -2 次 比较 剩 下 的 -1 个 元 素 ， 以 找到 最 小 元 素 ， 假 设 n22, ， 通 过 总 共 2m -3 
次 比较 ， 找 到 最 大 和 最 小 元 素 。 
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procedure MAXMIN(S): 
if [5|] = 2 then 
begin 


let 5 = (a, b}; 
return (MAX(a, b), MIN(a, b)) 


begin 
将 8 分 为 两 个 子 集 8 和 8， 每 个 子 集 都 有 一 半 的 元 素 ; 
(maxl, min!) - MAXMIN(S$,); 
(max2, min2) — MAXMIN(S,); 
return (MAX(maxl, max2), MIN(minl, min2)) 
end 





图 2-12 找到 MAX 和 MIN 的 过 程 


分 治 方法 将 集合 S 分 为 两 个 子 集 5, 和 S, BATEA n/2 个 元 素 。 通 过 算法 的 递归 应 用 ， 
算法 将 会 找到 两 个 子 集 的 最 大 和 最 小 元 素 。 可 通过 对 SH 5, 的 最 大 和 最 小 元 素 进 行 多 于 两 次 的 
比较 而 计算 出 S 的 最 大 和 最 小 元 素 。 详 细 算法 如 下 : 

算法 2. 3 找到 一 个 集合 的 最 大 和 最 小 元 素 。 

RA: 有 个 元 素 的 集合 S, n 是 2 KE, HA, n2, 

输出 :5 的 最 大 和 最 小 元 素 。 . 

方法 : 应 用 递归 过 程 MAXMIN FRA S; MAXMIN 有 一 个 变量 9 是 集合 S，1S1 =2, kel, 
MAXMIN 返回 一 对 值 (a, b), a. b 分 别 是 S 中 的 最 大 、 最 小 元 素 。 过 程 MAXMIN 在 图 2-12 中 
给 出 。 口 

注意 ， 需 要 在 $ 的 元 素 间 进行 比较 的 步 又 仅 是 步骤 3 和 步 又 7， 步 又 3 中 比较 S 的 两 个 元 素 ， 
25987 则 必须 比较 maxl 和 max2 以 及 minl 和 min2。 设 7T(n) 是 MAXMIN 在 n 个 元 素 的 数据 集 S 中 
找到 最 大 和 最 小 元 素 所 需 的 比较 次 数 。 显 然 ，7(2) =1。 如 果 n>2，T(n) 是 对 大 小 为 n/2 HH 
合 的 两 次 调用 MAXMIN 中 所 需 的 比较 次 数 ( 行 5、6) 加 上 第 7 行 的 两 次 比较 的 和 ， 即 ， 

Tn) = , 对 于 n=2 
27(n/2)+2 ”对 于 n>2 

函数 T(n) = (3/2)n- 2 是 递归 式 (2-2) HR. BR, n=2 时 式 (2-2 ) eB, ME n m(ma 

2) 时 , 式 (22) 满 足 ， 那 么 


(22) 


T(2m) = a -2) +2 = (2m) - 2 


因此 ,a =2m hf, (2-2). 这样， 通过 对 n 的 归纳 ， 可 以 知道 只 要 nn 是 2 OM, T(n) = 
(3/2)n -2 可 使 式 (2-2) 满 足 。 

可 以 证 明 在 n 个 元 素 的 集合 S 中 寻找 最 大 和 最 小 元 素 ， 至 少 需 要 进行 (3/2)n -2 次 比较 。 这 
样 ， 当 nn 是 2 的 等 时 ， 算 法 2.3 在 3 的 元 素 间 比较 的 次 数 是 最 优 的 。 

在 前 面 的 例子 中 ， 分 治 方法 的 使 用 减少 了 比较 次 数 的 常数 因子 倍 。 接 下 来 的 例子 将 说 明 如 
何 通 过 利用 分 治 技术 实际 减少 算法 的 渐 近 增长 率 。 

考虑 两 个 n 位 数 的 乘法 。 传 统 的 方法 需要 0(m ) 次 位 操作 。 下 面 的 方法 大 约 需 要 ne REE 
的 近似 值 n” 次 位 操作 。® 





日 ”由 于 仅 考虑 比较 ， 参 数 的 传递 方法 不 那么 重要 。 然 而 ， 如 果 集 合 S 用 数组 表示 ， 可 通过 传递 指向 5 的 子 集 的 第 
一 个 和 最 后 一 个 元 素 的 指针 有 效 地 调用 MAXMIN, Hp 5 的 子 集 是 数组 中 连续 的 元 素 。 
OQ ”除非 另 有 声明 ， 本 书 所 有 对 数 均 以 2 为 底 。 
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Bax Ay 为 两 个 mn 位 数 。 同 样 ， 为 了 简化 起 见 ， 假 设 ” 是 2 HEEL WE 2-13, 将 x My 分 为 
两 半 。 如 果 将 每 一 半 为 (2) 位 数 ， 那 么 ， 可 如 下 表示 乘积 : 


xy = (a2? +b) (c2? +d) (23) x= | a | 6 | 
pe [a | 


= ac2" + (ad + bc)2”? + bd 
方程 (2-3) 通 过 4 4 (1/2) 位 数 的 乘法 与 一 些 加 法 和 移 位 (通过 2 的 7 


PRERE) KHA x Aly 的 乘积 。* 和 y 的 乘积 z 也 可 以 用 以 下 程序 表示 。 
243 ”位 串 的 切 分 


u *- (a+ b) * (c d); (2-4) 
y asc; 
wbd; 
z*€-vx*2"c-(u—v—w) x» 275 -w 
end 


先 忽略 进位 的 时 候 a b 和 c+4d 可 能 是 (n/2 +1) 位 数 的 情况 ， 假 设 它 们 仅 是 n/2 位 数 。 为 了 
使 两 个 n 位 数 相 乘 ， 这 个 方案 仅 需要 (mn/2) 位 数 的 3 次 乘法 ， 加 上 一 些 加 法 和 移 位 。 可 以 递归 地 
使 用 乘法 来 计算 乘积 v，" 和 w。 加 法 和 移 位 需要 时 间 为 0;,(n)。 因 此 ， 两 个 n 位 数 相 乘 的 时 间 
复杂 度 的 上 界 为 
k WF n=l 
T(n) "bro th 对 于 n>1 
这 里 ,是 常数 ， 反 映 了 式 (24) 中 的 加 法 和 移 位 。 递 推 式 (2-5 ) 的 解 的 上 界 如 下 : 
l Bhn? 34m 9 


(2-5) 


实际 上 式 (2-5 ) 的 解 是 
T(n) =3kn'*? -2kn 
因为 ”是 2 BRE, Ha n 进行 归纳 ， 可 以 证 明 上 式 。 归 纳 基础 m= 1 是 平凡 的 。 如 果 n=m 时 ， 
T(n) =3kn -2kn 使 式 (2-5) 满 足 ， 那 么 对 于 递 推 步 ; 
T(2m) =37(m) +2km 

z3[3km"? -2km] +2km 

z23k(2m)"? -2k(2m) 
Hil, T(n) «3kn"?, ERA D, E GERI 3k" ARE 3kn"* -2kn 会 导致 失败 。 

为 了 完成 乘法 算法 ， 还 必须 考 虚 a+b 和 ct+d 是 (nr2+1) 位 数 的 情况 。 因 此 (e+b) (e e d) f 
乘积 不 能 直接 用 大 小 为 n/2 的 问题 的 递归 算法 计算 。 必 须 将 a + 写 为 27 +b, KPa (ath) 
的 最 高 位 ， 忆 为 剩 下 的 位 。 类 似 地 ,将 c+d 写 为 c2”“+d。(ae+p)(c+d) 的 乘积 可 以 表示 为 

a,c,2” + (a,d, +bcl)2 + bd (24) 
项 bd 可 递归 应 用 大 小 为 n/2 的 乘法 算法 进行 计算 。 式 (26) 里 面 的 其 他 乘法 运算 ,或 者 包括 一 
位 a, 和 c,， 或 者 是 2 的 敌 作 为 参数 ， 因 此 能 够 在 0,(n) 时 间 内 完成 。 

例 2.6 上 述 快 速 整数 乘法 算法 不 仅 可 应 用 在 二 进 制 上 ， 也 可 以 应 用 到 十 进 制 数 上 。 下 面 的 
计算 说 明了 这 个 方法 。 

x — 3141 a —31 c= 59 

y = 5927 b=41 d=27 
a+b=72 c+d=86 

u = (a + b) (c + d) = 72 x 86 = 6192 
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= ac = 31 x 59 = 1829 
w= bd= 41 x 27 = 1107 
= 18290000? + (6192 — 1829 — 1107) x 100 + 1107 
= 18616707 口 
注意 ， 基 于 式 (24) 的 算法 用 三 个 加 法 和 减法 代替 了 一 个 乘法 [ 与 式 (2-3) 比较 ]。 这 个 替换 为 什么 能 
够 导致 渐 近 高 效 的 直观 原因 是 乘法 比 加 法 的 执行 难度 更 大 ， 对 于 足够 大 的 上， 不 管用 什么 样 的 (已 
知 ) 算 法 ， 任 何 固定 的 ”位 的 加 法 都 比 ” 位 的 乘法 需要 的 时 间 少 。 初 步 看 来 ， 似 乎 (n2) 位 数 的 乘 的 
次 数 从 4 减 到 3， 最 好 情况 下 ， 能 够 减少 总 时 间 的 25% 。 然 而 ， 由 于 式 (24) 可 递归 地 应 用 于 计算 
(n/2) 位 、(n/4) 位 、… 的 乘积 。 由 于 每 级 都 节省 25% ， 因 此 渐 近 时 间 复 杂 度 得 到 提高 。 
一 个 过 程 的 时 间 复杂 度 是 由 子 问题 的 数量 和 大 小 决定 的 ， 而 将 问题 分 解 为 子 问题 的 工作 总 
量 也 会 对 其 产生 次 要 影响 。 形 如 式 (2-2) 和 式 (2-5) 的 递归 在 递归 分 治 算法 分 析 中 经 常 出 现 ， 下 面 
考虑 在 通常 状况 下 的 结果 。 
定理 2.1 ka, b,c 是 非 负 常数 。 递 推 式 
T(n) = Ü 对 于 n=1 


aT(n/c) * bn 对 于 n>1 
RHF n Ech, RE 
O(n) 车 a<e 
T(n) = [oos logn) Zia-c 
O(n**^) Barc 
证 明 : WMR n Ece, 那么 


log, n 
T(n) - bn > 7, 其 中 = a/c 


如 果 a<c， MAL or 收敛 ,因此 ，T(n) 为 O(n)。 如 果 a=e， 那 么 和 式 中 的 每 项 都 是 1， 
并 且 有 O(log n) 项 。 因 此 ， Tn) A O(n log n). 最 后 ， 如 果 a >c， 那 么 


pb _ 
"x = bn 一 一 六 


A O(a ^) RES F O(n"^), 口 

从 定理 2. 1 可 以 看 出 分 解 一 个 问题 (使 用 线性 工作 量 ) 为 一 半 大 小 的 两 个 子 问 题 ， 将 得 到 一 
个 O(n log n) 的 算法 。 如 果子 问题 的 数量 是 3、4 或 者 8， 那 么 算法 的 阶 分 别 为 me 、 严 或 者 十 。 
男 一 方面 ， 将 问题 分 割 为 4 个 大 小 为 n/4 的 子 问题 ， 也 得 到 O(nlog n) 的 算法 ， 而 9 和 16 个 子 问 
题 使 得 算法 的 阶 分 别 为 ww 和 于。 因此 ， 将 整数 分 为 4 部分， 而 且 能 够 根据 8 个 或 者 更 少 的 乘法 
来 表示 整数 的 乘法 ， 可 以 得 到 整数 乘法 的 浙 近 快速 算法 。 也 存在 着 一 些 重要 的 递 推 关系 ,其 分 害 
问题 的 工作 量 与 问题 大 小 是 不 成 比例 的 ， 其 中 有 些 将 在 习题 中 出 现 。 

在 ”不 是 。 的 宕 的 情况 下 ， 通 常 能 够 将 大 小 为 上 的 问题 嵌 和 人 到 大 小 为 普 的 问题 中 ， 其 中 性 大 
TEF n 的 最 小 c FE, Alb, E2 1 的 渐 近 增长 率 对 于 任意 的 = 成立。 实际 上 ， 我 们 经 常会 
设计 将 任意 大 小 的 问题 分 割 为 大 小 接近 <。 的 若干 子 问题 的 递归 算法 。 这 些 算法 通常 比 那些 通过 假 
设 输入 大 小 是 e 的 某 一 矫 而 得 到 的 算法 更 有 效 (相差 一 个 常数 因子 )。 


2.7 平衡 


分 治 技术 将 问题 分 解 为 大 小 相等 的 若干 子 问题 的 两 个 例子 并 不 是 一 个 巧合 。 好 的 算法 设计 的 一 
个 基本 原则 是 保持 平衡 。 为 了 解释 这 个 原则 ， 利 用 一 个 排序 的 例子 来 比较 将 问题 分 解 为 大 小 相等 的 


O "必须 移动 4 T HENN, u-v -w 则 移动 两 位 。 
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子 问题 和 大 小 不 相等 的 子 问题 的 效果 差异 。 读 者 请 不 要 从 例子 中 推定 平衡 仅 在 分 治 技术 中 有 用 。 第 
4 章 的 几 个 例子 说 明 对 子 树 规 模 进行 平衡 或 者 对 操作 的 代价 进行 平衡 将 会 使 算法 更 加 高 效 。 

考虑 m 个 整数 按 非 递 减 次 序 进 行 排序 的 问题 。 也 许 ， 最 简单 的 排序 方法 是 通过 扫描 序列 定位 最 
小 的 元 素 ， 然 后 交换 最 小 的 元 素 与 第 一 个 元 素 的 位 置 。 这 个 过 程 在 剩 下 的 n -1 个 元 素 间 重复 ， 并 
将 第 二 小 的 元 素 置 于 第 二 个 位 置 。 在 剩 下 的 n -2, n-3, =, 个 元 素 排 序 中 重复 这 个 过 程 。 

对 于 待 排序 元 素 间 的 比较 次 数 ， 由 算法 可 得 递归 式 

T(n) = p 对 于 n=1 
T(n-1) 4n-1 对 于 n>1 

式 (2 了 7) 的 解 是 7T(n) =n(n-1)/2, Bl O(n’). 

虽然 这 个 排序 算法 可 看 作 分 为 不 等 的 两 部 分 的 分 治 算法 的 递归 应 用 ,但 是 ， 对 于 大 n， 它 不 
够 有 效 。 为 了 设计 一 个 渐 近 有 效 的 排序 算法 ， 需 要 达到 平衡 。 将 问题 分 为 两 部 分 ， 不 是 一 部 分 为 
1， 另 一 部 分 为 n -1 的 做 法 ， 而 是 将 问题 分 解 为 接近 问题 大 小 的 一 半 的 两 个 子 问题 。 这 可 通过 电 
并 排序 方法 完成 。 

考虑 一 个 整数 序列 x, ，x, ，…，x,。 再 次 为 了 简化 问题 ,假设 a 是 2 的 敌 。 对 该 序列 排序 的 
一 种 方法 是 将 其 分 解 为 两 个 序列 x, ，x,，-…，x,w 和 x ,1，…，x,， 排 序 这 两 个 序列 ， 然 后 归 
并 。“ 归 并 ”的 意思 是 归并 两 个 有 序 的 序列 为 一 个 有 序 的 序列 。 

算法 2.4 归并 排序 。 

输入: 数值 序列 x,, x, +, x,, Hein ÉD BERE, 

输出 : 输入 序列 的 排列 y,，y,，…，y,， WE y my, mU my, 

方法 : 利用 过 程 MERGE(S, 7) 将 两 个 有 序 序列 S 和 了 作为 输入 ， PES SAT OA 
素 的 有 序 序列 作为 输出 序列 。 因 为 S$ 和 了 自身 有 序 ，MERGE 最 多 需要 S 和 7 了 的 长 度 之 和 减 1 次 
比较 。 通 过 反复 对 5 和 了 中 剩余 元 素 中 的 最 大 元 素 进行 比较 ， 选 择 其 中 较 大 的 元 素 ， 并 删除 所 选 
“元素 。 此 过 程 一 直 持 续 ， 直 到 $ 和 7 AS, 

也 可 以 利用 图 2-14 的 过 程 SORT(i, 门 对 序列 x,，x,,, ，…，x 和 排序， 假设 对 大 0， 子 序列 长 
BE 2", 


(2-7) 


为 了 排序 给 定 的 序列 x, X2, tta Xs. 可 调用 SORT(1, nN) 口 
在 计算 比较 次 数 时 ， 算 法 2. 4 的 递 推 关 系 为 : 
- 0 对 于 n=1 
TG) = {pen sna! WF n> 


根据 定理 2.1， 它 的 解 为 T(n) = 0(nlogn)。 对 于 n 很 大 的 情况 ,平衡 子 问题 的 大 小 带 来 的 益处 
是 很 大 的 。 类 似 的 分 析 显 示 ， 不 仅 是 比较 次 数 ， 过 程 SORT 所 需 的 总 时 间 也 是 O(n log n) o 





procedure SORT(i, j): 
if i = j then return x; 
else 


mo (i+j—1)/2; 
return MERGE(SORT(, m), SORT(m + 1, D) 
end 





图 2-14 ”归并 排序 


2.8 动态 规划 
如 果 通 过 合理 的 努力 能 够 将 问题 分 解 为 子 问题 ， 而 且 子 问题 大 小 的 总 和 能 够 保持 很 小 ， 递 











和 和 1: 


妇 技术 是 很 有 用 的 。 回 忆 定 理 2. 1， 如 果子 问题 大 小 的 总 和 是 an， 常 数 a。>1， 递 归 算 法 在 时 间 复 
杂 度 上 可 能 是 多 项 式 。 然 而 ， 如 果 划 分 大 小 为 n 的 问题 ， 却 导致 4 个 大 小 为 n -1 的 问题 ， 那 么 
算法 的 复杂 度 可 能 会 指数 增长 。 在 这 种 情况 下 ， 一 种 称 为 动态 规划 的 表 技 术 常会 使 算法 更 有 效 。 
本 质 上 ,动态 规划 计算 了 所 有 子 问题 的 解 。 计 算 过 程 是 从 小 的 子 问题 到 大 一 点 的 子 问题 ， 
并 将 结果 存储 在 表 中 。 这 种 方法 的 优点 是 一 旦 解决 了 子 问题 ， 就 将 结果 存储 下 来 ， 不 需要 重复 计 
算 。 这 个 技术 很 容易 用 一 个 简单 的 例子 解释 。 
考虑 mn 个 矩阵 乘积 的 计算 
M-M,xM,x-:-xM, 
这 里 每 个 ,都 是 一 个 nm- 行 rn 列 的 和 矩阵。 无 论 使 用 什么 样 的 矩阵 乘法 算法 ， 和 矩阵 相 乘 的 顺序 都 会 
对 计算 M 所 需 操 作 的 总 数 有 很 大 的 影响 。 
例 2.7 Bitpxq EER q xr BEER, ER BE, SEE pgr KBE, SRR 
M= M, x M, x M, x M, 
[10 x20] [20x50] [50x1] [1x100] (2-8) 
这 里 每 个 财 ,的 维 数 标 在 括号 中 。 以 顺序 
M=M, x(M, x (M, xM,)) 
HEM, HE 125 000 次 操作 ， 然 而 ， 以 顺序 
Mz(M,x(M,xM4)) xM, 
计算 M, NER 2200 次 操作 。 " 
为 了 最 小 化 操作 数量 ， 尝 试 所 有 可 能 的 计算 ”个 矩阵 乘积 的 顺序 是 一 个 指数 复杂 度 的 过 程 
(见习 题 2. 31) ， 这 个 过 程 当 很 大 的 时 候 是 不 实用 的 。 然 而 ， 动 态 规划 提供 了 一 个 O(m ) 的 算 
法 。 设 ms 是 计算 M; x M,a xe xM 的 最 小 代价 ， 1<i<j<n。 显 然 ， 
_ 0 #Hisj 
m Dum, tma trann) € j>i 
其 中 mi 是 计算 M' =M, x M, x … xM, 的 最 小 代价 。 第 2 项 m,,, 是 计算 
M'M,,.xM, xc x M, 
的 最 小 代价 。 而 第 3 ME MA Mr" 的 乘积 的 代价 。 注 意 M' 是 一 个 mr-; xn BER, M" Èr xr 的 
和 矩阵。 方程 (29) 说 明 考虑 了 i 和 j -1 之 间 所 有 可 能 的 上 值 ，m, 是 这 三 项 和 的 最 小 值 ， 其 中 j > i。 
动态 规划 方法 以 递增 下 标 值 的 方式 计算 m, 的 值 。 首 先 对 所 有 的 i 计算 m;， 然 后 对 所 有 的 i 
计算 mr ， 接 下 来 是 m,,,,， 依 此 类 推 。 这 样 ， 当 计算 my 时 ， 式 (2-9) 中 的 ms 和 m,,, ,都 能 够 用 
Bl, RAR, MRA I<k <j RBA, j -i 必须 严格 的 比 k-i 和 j-(k+1) 大 。 下 面 给 出 了 
算法 。 
算法 2.5 计算 ”个 矩阵 乘法 M x M, x… xM, 的 最 小 代价 顺序 的 动态 规划 算法 。 
RA: 1, AP, A r Bee MM: 的 维 数 。 l 
给 出 : MAREHEM, BEERE p xq AIER qxr 相 乘 需要 par 次 操作 。 
方法 : 算法 如 图 2-15 所 示 。 a 
512.8. 将 算法 应 用 到 式 (2-8 ) 中 的 4 个 矩阵 串 中 计算 my 的 值 ， 如 图 2-16 Bro, X 
中 rm，…， 分 别 为 10，20，50，1，100。 这 样 ， 计 算 乘 积 所 需 的 最 小 操作 数目 是 
2200 。 乘 法 操作 的 顺序 可 通过 记录 确定 ， 表 格 (2-9 ) 中 的 每 个 条 目的 上 值 给 出 了 最 小 的 操 
作 数 目 。 口 


(2-9) 
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begin 
for i — 1 until n do m, <— 0; 
for | — 1 until n — 1 do 
for i — 1 until n — | do 
begin 


jeitth 
my — MIN (mg + ments t rea IR n9) 
. isk«i 





2-6 计算 M, xMi x… x 用 的 代价 


2.9 后 记 


本 章 涉及 一 些 设计 有 效 算法 的 基本 技术 。 可 以 看 到 高 级 数据 结构 如 表 、 队 列 和 堆栈 的 使 用 
会 使 算法 设计 者 从 琐碎 的 工作 ， 如 操纵 指针 等 解放 出 来 ， 而 专注 于 算法 全 局 结构 的 考虑 。 还 可 以 
看 到 递归 和 动态 规划 的 功能 之 强大 ， 通 常 使 算法 优美 而 自然 。 本 章 也 给 出 了 像 分 治 和 平衡 这 样 
一 些 普遍 的 原则 。 

当然 这 些 并 不 是 仅 有 的 可 用 技术 ， 但 它们 比较 重要 。 本 书 的 其 他 章节 还 将 讨论 其 他 技术 。 
其 范围 将 涉及 问题 的 适当 表示 以 及 较 好 的 操作 顺序 的 选择 。 也 许 对 一 个 好 的 程序 设计 者 最 重要 
的 原则 是 永 不 满足 。 设 计 者 应 不 断 从 不 同 的 角度 验证 一 个 问题 ， 直 到 确信 他 的 算法 是 满足 需求 
的 最 合适 的 算法 为 止 。 


习题 


2.1 选择 一 个 双向 链表 的 实现 。 写 出 插入 、 删 除 一 个 数据 项 的 简化 ALGOL 算法 。 
确定 你 的 程序 在 删除 第 一 个 和 /或 最 后 一 个 数据 项 以 及 表 为 空 时 可 以 正确 执行 。 

2.2 ”编写 一 个 颠倒 表 中 数据 项 顺序 的 算法 。 并 证 明 该 算法 能 正确 运行 。 

2.3 编写 算法 ， 实 现 2. 1 节 中 提 到 的 操作 PUSH, POP, ENQUEUE 和 DEQUEUE。 不 要 忘记 检验 
指针 是 否 到 达 堆 栈 或 队列 的 数组 尾部 。 

2.4 编写 出 检测 队列 是 否 为 空 的 条 件 。 假 设 2. 1 节 中 的 数组 NAME KhA k, 那么 队列 可 存储 
多 少 元 素 ? 画图 说 明 当 队列 (a) 为 空 ，(b) 只 有 一 个 元 素 ，(e) 队列 满 时 ， 队 列 和 指针 
FRONT 及 REAR 的 位 置 。 

2.5 编写 一 个 删除 无 向 图 中 4 的 邻接 表 的 第 一 条 边 (v，w) 的 算法 。 假 设 邻 接 表 是 双向 链接 的 ， 
112.3 节 中 描述 的 那样 ， 可 使 用 LINK Æ w 的 邻接 表 中 定位 vo . 

2.6 编写 一 个 构造 无 向 图 的 邻接 表 的 算法 。 每 条 边 (*，w ) 表示 两 次 ， 一 次 是 在 "的 邻接 表 中 ， 
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*2.7 


*2.8 


*2.9 


2.10 


*2. 11 


*2. 12 


*2. 14 





g2* 


一 次 是 在 v 的 邻接 表 中 。 每 条 边 的 两 个 副本 必须 链接 到 一 起 ， 当 删除 一 个 ， 另 一 个 也 可 以 
方便 地 删除 。 假 设 输入 是 边 的 表 。 

(拓扑 排序 ) 设 CG=(V,，E) 是 有 向 无 环 图 。 写 一 个 为 6 的 顶点 赋 整 数值 的 算法 ， 如 果 存 在 一 
RATA DRA MAMA, Wits, (HR: 一 个 无 环 图 肯定 存在 一 个 顶点 没有 人 
边 。 为 什么 ? 解决 问题 的 一 个 方法 是 查找 没有 边 进入 的 顶点 ， 给 这 个 顶点 赋 最 小 值 ， 然 后 
将 它 和 它 的 所 有 出 边 从 图 中 删除 。 在 得 到 的 图 中 重复 这 个 过 程 ， 赋 下 一 个 最 小 值 ， 依 此 类 
推 。 为 了 使 算法 有 效 ， 即 时 间 复 杂 度 为 OC AE e+ 1V1 )， 必 须 避 免 在 每 一 个 新 产生 的 图 
中 查找 没有 进入 边 的 顶点 。] 

设 C=(V, EF) 是 有 两 个 指定 顶点， 起 始 顶 点 和 末尾 顶点 的 有 向 无 环 图 。 写 一 个 算法 ， 找 到 
一 组 从 起 始 顶 点 到 末尾 顶点 的 路 径 ， 使 得 

1) 除 了 起 始 或 末尾 顶点 ， 没 有 其 他 顶点 在 两 条 路 径 上 出 现 ; 

2) 没 有 其 他 的 满足 条 件 (1) 的 路 径 可 添加 到 集合 中 。 

注意 可 能 会 有 很 多 组 路 径 满足 上 述 条 件 。 不 需要 找到 路 径 最 多 的 一 组 ， 只 要 满足 上 述 条件 
就 可 以 。 算 法 执行 时 间 必 须 为 0( LE | + IVE). 

(稳定 婚姻 问题 ) 设 B 是 n 个 男孩 的 集合 ,CG 是 n 个 女孩 的 集合 。 每 个 男孩 将 女孩 从 1 
到 nn 排序， 每 个 女孩 将 男孩 从 1 到 排序。 配对 是 男孩 和 女孩 是 一 一 对 应 的 。 如 果 每 
两 个 男孩 ,和 b, 以 及 与 他 们 配对 的 女孩 g, 和 g, 满 足以 下 两 个 条 件 ， 则 称 配 对 是 稳 
定 的 : 

1)6, 的 排序 中 g, 比 e, E, RE g, 的 排序 中 5b, 比如 高 ， 

2)5, 的 排序 中 g, 比 g, 高 ， 或 者 2, HFF 6, tt 5, 高 ， 

证 明 稳定 配对 总 是 存在 的 ， 写 出 一 个 算法 找到 一 个 这 样 的 配对 。 

考虑 每 个 顶点 都 有 名 字 的 二 叉 树 。 写 一 个 算法 按 (a) 前 序 、(b) 后 序 和 (ce) 中 序 ， 打 印 出 
名 字 。 

写 一 个 算法 计算 带 有 + 和 x 的 算术 表达 式 的 (a) RR. (b) rm Ce) 后缀 波兰 表 
达 式 。 i 

FR-BRA, EEKEREN, BOIL 0, Mia Ree S HEAR RE 
时 间 OC 1 V 1”)。[ 提 示 : 保持 每 个 初始 化 过 的 项 的 指针 为 指向 堆栈 中 后 面 的 指针 。 每 
存 取 一 项 ， 通 过 确定 那个 项 的 指针 指向 堆栈 的 活动 区 域 ， 而 且 栈 的 后 面 指针 指向 该 项 ， 
从 而 验证 该 项 的 内 容 不 是 随机 的 。] 

对 图 2-17 的 二 叉 树 模拟 算法 2. 1 和 算法 2. 2。 


LEFTSON RIGHTSON 





图 2-17 ”二叉树 
证 明 算 法 2.2 是 正确 的 。 
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*2. 15 


** 2. 16 
*2. 17 
2. 18 


2. 19 
2. 20 
** 2,21 


2.22 


*2.23 


2.24 


*2. 25 


( 汉 诺 塔 ) 汉 诺 塔 问题 包括 3 个 标 桩 A. BL C An 个 不 同 大 小 的 方 盘 。 开 始 时 ， 方 盘 以 递 
减 的 尺寸 顺序 堆积 在 标 桩 A 上 ， 最 大 的 方 盘 在 底部 。 问 题 是 每 次 将 一 个 方 盘 从 A 移 到 B, 
并 且 没 有 方 盘 放 置 在 比 自身 小 的 方 盘 上 。 标 桩 C 能 够 用 于 暂时 存放 方 盘 。 编 写 一 个 递归 
算法 解决 这 个 问题 。 以 一 个 方 盘 移动 所 耗费 的 时 间 为 单位 ， 算 法 的 执行 时 间 是 多 少 ? 
求解 习题 2. 15 的 非 递归 算法 。 考 虑 哪个 算法 更 容易 理解 并 证 明 是 正确 的 ? 

证 明 2^ -1 次 移动 对 于 解决 习题 2. 15 是 充分 和 必要 的 。 

写 一 个 产生 整数 1 到 n 的 所 有 排列 的 算法 。[ 提示 : 整数 1 到 "的 排列 的 集合 能 够 通过 在 
整数 1 到 n -1 的 每 个 排列 中 的 可 能 位 置 插 人 n 而 得 到 。] 

写 一 个 求 出 二 叉 树 高 的 算法 。 假 设 树 如 图 2-7b 所 示 。 

写 一 个 计算 树 中 每 个 顶点 的 后 代数 量 的 算法 。 

考虑 有 两 个 输入 和 两 个 输出 的 双 位 置 开 关 ， 如 图 2-18 所 示 。 在 一 个 位 置 输入 1 和 2 与 输出 
1 和 2 分 别 连接 。 在 另 一 个 位 置 输入 1 和 2 分 别 与 输出 的 2 和 1 连接 。 用 这 种 开关 ， 设计 
一 个 有 nn 个 输入 和 个 输出 的 网 络 ， 它 能 得 到 输入 的 n! 个 任意 可 能 的 排列 。 网 络 必须 用 
WF 0(nlogn) 个 开关 。[ 提示: 利用 分 治 方法 。] 


Input 1e—— —— € — — — —9— e Output 1 
P 


input 2e— —  —e. —_ -— —— —. Output 2 


~ 一 一 在 位 置 1 连接 
es 在 位 置 2 连接 
Æ 2-18 双 位 置 开 关 
写 一 个 RASP 程序 模仿 以 下 程序 计算 | n) o 
procedure COMB(n, m): 


if m = 0 or n = m then return | 
else return (COMB — 1, m) + COMB(n — 1, m— 1) 


当 调 用 时 ， 用 堆栈 存储 ”和 普 的 当前 值 、 返 回 值 以 及 值 地 址 。 


在 很 多 情况 下 ， 大 小 为 n 的 问题 可 以 方便 地 分 成 大 小 为 Va 的 Yn 个 子 问题 。 如 下 形式 的 递 
归 方 程 结果 如 下 


2 
(3) =nT(n) +br? 


其 中 7 是 整数 ,，r 宇 1。 证 明 方程 的 解 是 O(n(log n)'log log n), 
求 和 : 
a) Yi b) Yo c) Yo d) y 


i=l 


eO ín Mun 
9X0 — 9X) 
BTO) =1， 解 以 下 递 推 关系 : 
a)T(n) »aT(n-1) +bn b)T(n) 2 T(n/2) + bn log n 
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c)T(n) zaT(n-1) «bn d) T(n) 2aT(n/2) + bn‘ 
*2.26 通过 允许 递归 下 降 到 | S] = 1， 修 改 寻 找 集合 最 大 和 最 小 元 素 的 算法 2.3。 比 较 次 数 的 
渐 近 增长 率 是 什么 ? 
**2.27 证 明 ， 为 了 找到 一个 元 素 的 集合 中 的 最 大 和 最 小 元 素 , [| (3/2)m - 2 1 次 比较 是 必要 和 充 
分 的 。 
*2.28 ”修改 整数 乘法 算法 ， 分 割 整 数 为 (a)3 部 分 和 (b)4 部 分 。 算 法 的 复杂 度 是 什么 ? 
*2.29 设 4 是 大 小 为 n 的 正 整数 或 负 整 数 的 数组 ， 其 中 A[1] <4[2]<…<4fn] 。 写 一 个 算法 找 
到 i, EAL] =i, 假设 这 样 的 i 存在 。 算 法 的 执行 时 间 复 杂 度 为 何 ? 
证 明 Oc (logn) 是 最 好 的 可 能 。 
*«2.30 ”如 果 在 算法 2.4 中 ,n 不 是 2 BOE, FEE 2-14 中 的 语句 me-(i+j -1)/2 替换 为 me-| (i+ 
站 /2」， 能 够 得 到 一 个 有 效 的 归并 排序 算法 。 设 T(n) 是 用 这 种 方法 排序 n 个 元 素 的 比较 
次 数 。 
a) 证 明 
T(1) «0 
T(n) =T( n/2]) * T([ n/21) *n-1 
b) 证 明 这 个 递归 的 解 是 
T(n) 2n[logn] -2/*" +1 
*2.31 证 明 递 归 
X(1) =1 
X(n) = Y X(i)X(n - i) 对 于 n>1 
的 解 是 
1 /2n 
X(n+1) "iul | 
X(n) 是 将 = 个 符号 的 串 全 部 括 人 括号 的 方法 数量 。X(n) B (E EI HERA X(n) 
22°", 
2.32 ”修改 算法 2. 5 使 其 输出 标量 乘法 数量 减 到 最 小 的 矩阵 相 乘 的 顺序 。 
2.33” 写 出 一 个 有 效 算法 ， 对 固定 的 4， 当 每 个 W 的 维 数 为 1 x1，1 xd, dx1 或 者 4xd 时 , 能 
够 确定 计算 矩阵 M, xM, x … x M. 乘 积 的 顺序 ， 使 得 标量 乘法 的 数量 最 小 。 
定义 乔 姆 斯 基 范 式 的 上 下 文 无 关 语 法 C 是 一 个 4 元 组 (NW， 卫 ，P，S) ， 其 中 (1)N 是 一 
个 非 终结 符 的 有 限 集 合 ，(2) 卫 是 一 个 终结 符 的 有 限 集合 ，(3) 称 已 是 一 个 产生 的 有 限 对 
集合 ， 具 有 4 一 BC 或 者 4 一 a 的 形式 ， 其 中 4, B, CEN P, aX v, (SE NBN 
AT. dna, B, y 是 终结 符 和 非 终结 符 串 ， 而 且 4- 妆 在 已 中 ， 则 oMy-oBy. GE 
生 的 语言 L(G) 是 终结 字符 串 的 集合 {fw1 S 坊 w} ， 其 中 过 是 性 的 自 反 和 传递 闭 包 。 
*2.34 B+ O(n ) 的 算法 确定 给 定 的 申 w=aia,…a, 是 否 在 L(G) 中 , 其 中 G=(N, X, P, S) 
是 一 个 乔 姆 斯 基 范 式 的 上 下 文 无 关 语法 。[ 提示; 设 m = |41 Ae NA Adaa, ato 
当 且 仅 当 Semn 时 ，w ezZ(C) 。 可 使 用 动态 规划 计算 mo] 
*2.35 设 * 和 7 是 某 个 字母 表 的 符号 串 。 考 虑 从 x 中 删除 一 个 符号 ， 在 x 中 插入 一 个 符号 和 替换 
x 中 一 个 符号 的 操作 。 描 述 一 个 算法 ， 求 将 * 转换 为 y 需要 的 最 小 的 操作 数目 。 
文献 及 注释 





更 多 的 关于 数据 结构 及 其 实现 的 信息 可 在 Knuth[ 1968 ] 或 Stone[ 1972] 中 找到 。Pratt[ 1975] 
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包含 用 类 ALGOL 语言 实现 递归 的 描述 。Berge[ 1958 ] 和 Harary[ 1969] 讨论 了 图 论 。 关 于 树 和 树 的 
遍历 可 参考 Knuth[ 1968 ] 。Burkhard[ 1973 ] 是 树 遍 历 算法 的 另 一 本 参考 书 。 
Pohl[ 1972] 给 出 了 算法 2.3( 求 最 大 和 最 小 值 ) 的 优化 算法 。2. 6 WPR OC”) 的 整数 乘法 
算法 是 由 Karatsuba 和 Ofman[ 1962 ] 提 出 的 。Winograd[ 1973 ] 则 从 更 通用 的 角度 考虑 了 这 种 加 速 。 
动态 规划 的 使 用 是 由 Bellman[ 1957 ] 推广 开 来 的 ， 算 法 2.5 是 由 Godbole[ 1973 ] 和 Muraoka 以 
及 Kuck[ 1973 ] 提 出 的 著名 应 用 。 动 态 规划 应 用 于 上 下 文 无 关 语 法 的 识别 (习题 2. 34) 是 了 Cocke, 
Kasami[ 1965 ] 和 Younger[ 1967 ] 独立 工作 的 结果 。 习 题 2. 35 的 解 可 参阅 Wagner 和 Fischer[ 1974] 。 
更 多 关于 解 递 推 方程 的 信息 ， 可 以 参阅 Liu[ 1968 ] 或 者 Sloane[ 1973], 








第 3 章 排序 和 顺序 统计 


本 章 将 考虑 两 个 重要 的 相关 问题 ， 元 素 序 列 的 排序 和 在 一 个 序列 中 选择 第 小 的 元 素 。 将 一 
个 序列 排序 意 指 重新 排列 序列 中 的 元 素 ， 使 元 素 以 非 递增 或 者 非 递 碱 的 顺序 排列 。 通 过 将 序列 
排列 为 非 递减 序列 ， 然 后 在 结果 序列 中 选择 第 有 个 元 素 ， 就 能 在 序列 中 找到 第 小 的 元 素 。 不 
过 ,我 们 会 看 到 ,还 有 比 这 种 方法 更 快 地 选择 第 小 元 素 的 方法 。 

排序 是 一 个 对 于 实践 很 重要 同时 在 理论 上 又 很 有 趣 的 问题 。 因 为 相当 一 部 分 商业 数据 的 处 
理 都 涉及 对 大 量 数据 排序 ， 所 以 ， 有 效 的 排序 算法 对 于 经 济 性 而 言 相 当 重要 。 即 使 在 算法 设计 
中 ， 对 元 素 序列 的 排序 处 理 也 是 很 多 算法 的 基本 部 分 。 

本 章 将 考虑 两 类 排序 算法 。 第 一 类 算法 利用 元 素 的 结构 进行 排序 。 例 如 ， 如 果 排 序 元 素 是 
在 圈定 范围 0~m -1 中 的 整数 ， 那 么 能 够 在 0(n +m) 的 时 间 内 对 个 元 素 的 序列 排序 。 如 果 要 
排序 的 元 素 是 固定 字母 表 的 字符 串 ， 那 么 字符 串 序 列 的 排序 时 间 与 字符 串 长 度 的 和 是 线性 成 比 
例 的 。 

第 二 类 算法 假设 待 排序 的 元 素 没 有 结构 。 基 本 操作 是 一 对 元 素 间 的 比较 。 由 于 算法 具有 这 
种 特性 ， 可 以 看 出 对 有 n 个 元 素 的 序列 进行 排序 至 少 需要 n log n 次 比较 。 这 里 将 给 出 两 个 
O,(n log n) ET SEIS: 一 种 是 堆 排序 ， 最 坏 情 况 下 复杂 度 是 O(n lg n); 另 一 种 是 快速 排序 ， 
期 望 情况 下 时 间 复 杂 度 是 0.(n log n), 


3.1 排序 问题 


定义 集合 $ 的 偏 序 是 一 个 关系 尺 ， 对 $ 中 的 元 素 a、b 和 ee HR: 

1)aRa 为 真 ( 尺 是 自 反 的 ) 

2)aRb 和 bRc BYR aRc(R 是 传递 的 ) 

3)aRb 和 bRa ZR a = b(R 是 反对 称 的 ) 

整数 的 关系 所 和 关系 C( 和 集合 包含 ) 是 偏 序 的 两 个 例子 。 

集合 S 的 线性 序 或 者 全 序 是 S 上 的 一 个 偏 序 关系 ， 使 得 对 每 对 元 素 a,，b，， 有 aRb 或 者 bRa。 
整数 的 关系 三 是 一 个 线性 序 ;” 集 合 的 关系 GE 不 是 线性 序 。 

可 以 用 如 下 方式 表述 排序 问题 。 给 定 一 个 集合 的 n 个 元 素 的 序列 a, ，a, ，…，a,， 该 集合 上 
的 线性 序 经 常 表示 为 <。 我 们 可 以 找 出 这 个 元 素 的 一 个 排列 7: as 2,0, s 8,0, EHE 
给 定 序 列 映射 为 一 个 非 递减 序列 ， 使 a, Saran ，1<i<n。 通 常 需要 对 序列 自身 进行 排序 而 不 
是 对 排列 m HET. 

排序 方法 分 为 内 部 排序 (数据 已 经 在 随机 访问 存储 器 中 ) 和 外 部 排序 (数据 主要 在 随机 访问 存 
储 器 之 外 ) 。 外 部 排序 作为 计算 数据 处 理应 用 的 一 部 分 ， 通常 涉及 的 元 素数 量 比 在 随机 访问 存储 
器 中 进行 一 次 排序 的 元 素 多 很 多 。 因 此 ， 在 辅助 存储 设备 ( 如 磁盘 或 者 磁带 ) 上 进行 数据 的 外 部 
排序 具有 重大 的 商业 意义 。 

内 部 排序 在 算法 设计 和 商业 应 用 中 都 很 重要 。 在 排序 作为 其 他 算法 的 一 部 分 的 情况 下 ， 为 





O ”对 于 线性 序 < ， 正 如 通常 期 望 的 那样 ， 可 用 a < 上 表示 es 且 czxb。 MHA, b»o5a«bf]X, bza t5 asb 
同 义 。 





a ae ae ae aa Le ae as ae a 7 a © 
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了 适合 随机 访问 存储 器 ， 要 排序 的 数据 项 的 数量 通常 比较 小 。 然 而 ， 这 里 假设 要 排序 的 数据 项 的 
数量 足够 。 如 果 只 是 对 少量 数据 项 排序 ， 使 用 简单 的 策略 ， 如 复杂 度 为 On ) 的 “ 冒 泡 排 序 ”( 见 
习题 3. 5 ) 更 合适 。 

排序 算法 有 很 多 种 。 本 书 并 不 想 列举 所 有 重要 的 排序 算法 ， 而 只 介绍 在 算法 设计 中 有 用 的 
方法 。 首 先 考虑 要 排序 的 元 素 是 整数 或 者 (几乎 等 同 于 ) 有 限 字母 表 的 字符 串 的 情况 。 可 以 看 到 ， 
此 类 排序 能 够 在 线性 时 间 内 完成 。 接 下 来 ， 考 虑 没有 利用 整数 和 字符 串 特殊 性 质 的 排序 问题 ， 此 
时 ， 只 能 依赖 于 被 排序 元 素 的 比较 结果 对 程序 进行 分 支 。 在 这 种 情况 下 ， 对 有 个 元 素 的 序列 排 
序 ，0(nlogn) 次 比较 是 必要 的 也 是 充分 的 。 


3.2 基数 排序 


现在 开始 研究 整数 排序 ， 令 a, a,，…，a, 是 0 - m - 1 之 间 的 整数 组 成 的 序列 。 如 果 m 不 是 
太 大 ， 这 个 序列 可 以 很 容易 地 用 以 下 方式 排序 。 

1) 初 始 化 m 个 空 队 列 ， 每 一 个 队列 对 应 0 ~m -1 中 的 一 个 整数 。 每 个 队列 称 为 桶 。 

2) 从 左 到 右 扫 描 序 列 a, ，a,，…，a,， 将 元 素 a, 放 到 第 a, 个 队列 中 。 

3) 连 接 这 些 队列 (队列 i+1 的 内 容 加 到 队列 i 的 末端 ) ， 得 到 排序 结果 。 

由 于 能 够 在 常数 时 间 内 将 一 个 元 素 插 入 第 i 个 队列 ， 所 以 n 个 元 素 能 够 在 0(n) 时 间 内 插入 
队列 。 连 接 m 个 队列 需要 的 时 间 为 O( m) 。 如 果 m 是 0(n)， 那 么 算法 用 O(n) KOT HERR n 
整数 。 这 种 算法 一 般 称 为 桶 排序 。 

桶 排序 能 够 扩展 为 对 整数 元 组 (例如 表 ) 序列 进行 排序 ， 此 时 按 字典 序 排序 。 设 三 为 集合 $ 
MAHER, WO, s. 7, 5,)<(t, b. oo, t), ， 确 切 地 说 ， 当 以 下 两 个 条 件 之 一 满足 时 ， 

1) 存 在 整数 ]， 使 得 s <u, WERFAN i<j, s = 

2) 对 于 1<isp, p<g MHs, =t; 

被 扩展 为 元 组 (其 元 素来 自 $) 的 关系 和 是 字典 序 。 例 如 ， 如 果 将 字母 组 成 的 字符 串 ( 基于 自 
然 字 母 顺 序 ) 当 作 元 组 ， 那 么 字典 中 的 词 就 是 以 字典 序 排列 。 

首先 将 桶 排序 推广 到 由 元 组 序列 ，& 元 组 的 元 素 是 0 ~m -1 间 的 整数 。 通 过 次 对 序列 进 
行 桶 排序 操作 ， 可 实现 排序 。 在 第 一 次 操作 时 ,& 元 组 根据 它们 的 第 k 个 元 素 排序 。 第 二 次 操作 
的 结果 序列 根据 第 (& -1) 个 元素 排 序 。 根 据 第 二 次 操作 的 结果 ， 第 三 次 操作 序列 对 第 (k -2) 个 
元 素 排序 ， 依 此 类 推 。 第 上 次 (最 后 一 次 ) 操 作 序列 根据 第 一 个 元 素 对 (上 -1) 次 的 结果 排序 。S 序 
列 现在 是 字典 序 。 算 法 的 准确 描述 如 下 。 

算法 3. 1 字典 排序 。 

输入 : 一 个 序列 4 ，4: ，…，4,， 其 中 A, 是 一 个 大 元 组 

(25,25, Ut, aa) 

Qs 是 一 个 0 ~m -1 之 间 的 整数 。( 实 现 k 元 组 序列 的 便捷 数据 结构 是 一 个 n xk 的 数组 。) 

输出 : 一 个 序列 Bl|，B,，…，B,， 它 是 4,，4,，…，4, 的 排列 ,满足 B.<B,,,， 其 中 1<i<n。 

方法 : 将 上 元 组 4, 传递 给 某 个 桶 ， 只 需 移 动 指向 4, 的 指针 。 这 样 ，4, 能 够 在 固定 的 时 间 
而 不 是 在 k 时 间 内 添加 到 一 个 桶 中 。 用 称 为 QUEUE 的 队列 保存 当前 ”的 元 素 序列 。 用 数组 
Q 来 存储 m SH, APR 0 [让 存储 当前 操作 元 素 中 包含 着 整数 i 的 上 元 组 。 算 法 如 
图 3-1 所 示 。 口 


O 在 很 多 情况 下 ， 仅 根据 第 一 个 元 素 进行 字符 串 的 桶 排序 就 足够 了 。 如 果 放 人 桶 的 元 素数 量 很 小 ， 那 么 可 以 直接 
如 冒 泡 排序 ， 对 每 个 桶 中 的 字符 串 进行 排序 。 














n 
place 41, 4s, .... A, in QUEUE; 
for j <— k step — 1 until 1 do 

in 


for | «- 0 until m — 1 do make Q[/] empty; 
while QUEUE not empty do 


let A, be the first element in QUEUE; 
move A, from QUEUE to bucket Q [ay] 
end; 
for | *- 0 until m — ! do 
concatenate contents of Q[/] to the end of QUEUE 
end 





图 3-1 字典 排序 算法 


定理 3.1 算法 3.1 在 O((m+n)k) 时 间 内 ， 按 字典 序 对 长 度 为 n 的 上 元 组 序列 进行 排序 ， 
其 中 ,上 元 组 的 每 个 元 素 都 是 0 ~m -1 HER, 

EA: 通过 对 外 部 循环 的 执行 次 数 进行 归纳 ， 以 证 明 算 法 3. 1 是 正确 的 。 归 纳 假设 是 在 r 次 
执行 后 ，QUEUE 中 的 元 组 已 按照 右边 第 7 个 元 素 的 字典 序 排 好 。 一 旦 观察 到 第 (r +1) 次 排序 
是 对 站 元 组 右边 的 第 (r+ 1) 个 元 素 进行 操作 的 事实 ， 如 果 两 个 上 元 组 放 在 同一 个 桶 中 且 按 照 右边 
第 r 个 元 素 的 字典 序 排列 。 第 一 个 元 组 位 于 第 二 个 元 组 之 前 ， 则 可 以 很 容易 得 出 结果 。 

算法 3. 1 的 一 趟 外 部 循环 需要 的 时 间 为 0(m + n)。 循 环 重复 上 次 的 时 间 复 杂 度 为 0( (m+ 
n)k), " 

1153. 1 有 各 种 应 用 。 它 在 很 长 一 段 时 间 内 用 于 穿孔 卡片 排序 机 。 它 也 可 以 用 于 在 0(kn) 的 
时 间 内 排序 O(n) 4 0 ~n -1 之 间 的 整数 ， 因 为 可 以 将 这 种 整数 看 作 以 0 ~n -1 之 间 的 数组 成 的 
上 元 组 。( 即 以 ”为 基数 的 整数 表示 。) 

桶 排序 最 终 推广 到 应 用 于 大 小 不 同 的 元 组 ( 称 为 串 ) 。 如 果 最 长 的 串 长 度 为 上 ， 则 可 以 给 每 个 串 
填充 一 个 特殊 的 符号 ， 使 得 所 有 的 串 长 度 为 上 ， 然 后 应 用 算法 3. 1。 然 而 ， 如 果 只 有 几 个 长 串 ， 则 这 
种 方法 会 由 于 以 下 两 个 原因 而 造成 效率 低下 。 首 先 ， 每 次 操作 都 要 检测 每 个 串 ， 其 次 ， 即 使 几乎 所 
有 的 桶 都 是 空 的 ， 还 是 要 检测 每 个 桶 C[i]。 下 面 将 给 出 一 种 时 间 为 0(m+ 1,) ， 对 于 个 不 同 长 度 
的 串 序列 排序 的 算法 ， 其 中 /是 第 ;个 串 的 长 度 ， 而 且 lu = Zi.1l:。 串 的 元 素 在 0 ~m -1 的 范围 
内 。 该 算法 在 m 和 1 都 是 0(n) 时 ， 是 很 有 用 的 。 

该 算法 的 本 质 是 首先 将 串 按 长 度 递减 的 顺序 排序 。 设 1 为 最 长 的 串 的 长 度 。 接 下 来 ， 像 算 
法 3. 1 那样， 进行 1. 次 桶 排序 操作 。 然 而 ， 第 一 次 排序 操作 ( 按 最 右边 的 元 素 排序 ) 只 对 长 度 为 
lo BIRET. B- KHF OREB Oa ~ 1) 个 元 素 ) 时 串 的 长 度 至 少 为 1。 -1， 依 此 类 推 。 

例如 ,假设 bab, abc 和 a 是 三 个 待 排 序 的 捉 ( 虽 然 假设 元 组 的 元 素 是 整数 ,但 为 了 表示 方 
E, 我们 使 用 字母 。 这 不 会 带 来 困难 ， 因 为 可 以 用 0、1 和 2 来 代 蔡 a、b Alc), KHL =3, Br 
以 ,第 一 次 排序 仅 对 前 两 个 串 按照 它们 的 第 三 个 元 素 进 行 排序 。 在 排序 时 ,将 bab BLA bii, HE 
abc A c Hi, a 桶 为 空 。 第 二 次 操作 则 根据 前 两 个 串 的 第 二 个 元 素 对 它们 进行 排序 。 现 在 ，c 桶 
Tü b RRA, c 桶 仍然 为 空 。 在 第 三 次 和 最 后 一 次 排序 中 ， 对 所 有 三 个 串 根 据 它们 的 第 一 个 
元 素 进行 排序 。 这 次 a MA b RERA R, 桶 为 空 。 

可 以 看 到 ， 通 常情 况 下 ， 某 一 次 排序 时 很 多 桶 可 能 为 空 。 这 样 ， 在 某 一 次 排序 时 判定 哪些 
桶 是 非 空 的 处 理 步 又 是 很 有 益 的 。 由 于 每 一 趟 的 非 空 桶 列表 由 递增 桶 编号 确定 ， 这 人 允许 算法 在 
与 非 空 桶 数 成 比例 的 时 间 内 对 非 空 桶 进行 连接 。 
算法 3.2 对 不 同 长 度 的 串 进 行 字典 排序 。 
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输入 : 串 ( 元 组 ) 序 列 A,, A,, cos, A HICKRBO~m-1 之 间 的 整数 。 设 /4 是 4 = (au, 
aa, °°, a, BRE, VEL, JE LB Xf. 

输出 ; A 的 排列 B,, B,, =, B,, 满足 B,<B,<---<B, 

方法 : 

1) 对 每 个 1<l1<1) ， 为 符号 造 一 个 表 ， 这 些 符号 是 出 现在 一 个 或 多 个 串 的 第 ! 个 元 素 中 的 。 
首先 对 4, 的 每 个 元 素 cy ， 其 中 1 和 ij 生 nm，1 生 1 和 上 ， 创 建 一 个 (1，az ) 对。 这样 的 对 表示 某 串 的 第 ! 个 元 
素 包 含 整数 a,; 然后 使 用 算法 3. 1 的 显 式 推广 进行 字典 排 序号 接 下 来 ， 通 过 从 左 到 右 扫描 排序 表 ， 很 
容易 创建 /个 排序 表 NONEMPTY[1] ， 其 中 1<1<1,,， 这 样 ，NONEMPTY[ 1 确实 包含 出 现在 申 的 第 1 
个 元 索 的 符号 。 也 就 是 说 ，NONEMPTY[1] 有 序 地 包含 了 所 有 整数 j， 使 得 对 某 些 ;5，ax =j。 

2) 确定 每 个 串 的 长 度 。 创 建 表 LENCTH[!], 1</</,,, Hf LENGTH[I] G3& PUR KREK I 
的 串 。( 虽 然 我 们 说 的 是 移动 一 个 串 ， 但 实际 上 移动 的 仅仅 是 指向 串 的 指针 。 这 样 ， 每 个 串 都 能 
够 用 固定 数量 的 步骤 加 入 到 LENGTH 1] FP.) 

3) 现 在 ,. 像 算法 3.1 那样 ， 从 位 置 ,处 的 元 素 开 始 对 串 排序 。 然 而 ,在 第 i 次 排序 后 ， 
QUEUE RBE KEX lu -i+1 REKKAR, KERR 1 -i+1 到 1, 元素 已 经 按 字典 序 排 好 
了 。 在 步骤 1 中 计算 的 表 NONEMPTY 用 来 确定 在 每 次 桶 排序 操作 中 占据 哪些 桶 。 这 个 信 uide 
于 加 快 桶 的 连接 速度 。 图 32 给 出 了 算法 的 简化 ALCOL 语言 实现 。 


make QUEUE empty; 
for j — 0 until m — | do make Q[/] empty: 
for | — /nx step — | until 1 do 

begin 


concatenate LENGTH([/!] to the beginning of 
QUEUE.O 
while QUEUE not empty do 


let A, be the first string on QUEUE; 
move A, from QUEUE to bucket Qlan} 


end; 
for each j on NONEMPTY [!] do 
begin 


concatenate Q(j] to the end of QUEUE; 
make Q[] empty 





@ 从 技术 上 说 ， 仅 连接 到 队列 的 末尾 ， 但 连接 到 队列 头 并 从 概念 上 说 并 不 会 
带 来 困难 。 针 对 本 例 ， 最 有 效 的 方法 是 首先 从 第 6 行 的 LENGTH[Z] 中 选择 
A, AVE, REA QUEUE 中 选择 它们 ， 而 不 用 连接 LENGTH] 和 QUEUE. 


图 3-2 不 同 长 度 串 的 字典 排序 


例 3.1 下 面 用 算法 3.2 HET B a, bab 和 abc。 图 3-3 是 一 种 可 能 的 表示 这 些 串 的 数据 结构 。 
STRING 是 一 个 数组 ，STRING[ i 是 指向 第 i 个 串 的 表示 的 指针 ， 串 的 长 度 和 元 素 存 储 在 数组 DA- 
TA P, STRING[ 指向 的 DATA 中 的 单元 给 出 第 i 个 串 的 符号 数 j。DATA 中 接 下 来 的 j 个 单元 包 
含 这 些 符号 。 


O 在 算法 3.1 中 ,假设 元 素 是 从 同一 个 字母 表 中 选择 的 。 这 里 第 二 个 元 素 的 到 值 范围 是 0 ~ m - 1， 而 第 一 个 元 素 
的 取 值 范围 是 1 ~ les 。 
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和 算法 3. 2 所 用 的 串 表 实际 上 是 指针 表 ， 就 像 数 组 STRING 那样 。 
为 了 表示 方便 ， 本 例 后 面 的 部 分 将 在 表 中 写 人 实际 的 串 ， 而 不 是 指向 
串 的 指针 。 记 住 ， 存 储 在 队列 中 的 是 指针 而 不 是 串 本 身 。 
算法 3.2 的 第 1 部 分 针对 第 一 个 串 创建 了 对 (1，e) ; 第 二 个 串 创 
建 对 (1, b), (2, a), (3, b); 第 三 个 串 创建 对 (1，a) (2, b), 
(3，c) 。 这 些 对 的 有 序 表 是 ， 
(1, a), (1, a), (1, b), (2, a), (2, b, (3, b), (3, c) 
从 左 到 右 扫描 这 个 排序 表 ， 可 推出 
NONEMPTY[1] =a, b 
NONEMPTY[2] =a, b 
NONEMPTY[3] =b, c 
算法 3.2 的 第 2 部 分 计算 10 =1, 1,=3 Mil, =3, FÆ, LENCTH[1] 
=a, LENGTH[2]7gZ3, LENGTH[3] = bab, abc, Wik, Yr3&1558 3 部 分 PE 3-3 SA HRS hy 
一 开始 就 设 QUEUE = bab, abc 并 按照 它们 的 第 三 个 元 素 排 序 这 些 串 。 
NONEMPTY[3] =b, c 使 我 们 确信 当 在 图 3-2 的 第 8 ~10 行 生成 排序 表 时 ，0Q[a] 不 需要 连接 在 QUEUE 
的 尾部 。 这 样 ， 在 图 3-2 的 第 3 ~ 10 行 的 第 一 次 循环 执行 完毕 之 后 ，QUEUE = bab, abc, 
在 第 二 次 操作 时 ，QUEUE 不 变 ， 因 为 LENGTH[2] 为 空 ， 而 且 按 照 第 二 个 元 素 排序 没有 改变 顺 
序 。 第 三 次 操作 时 ， 在 第 4 行 设 QUEUE 为 a，bab，abc。 根 据 第 一 个 元 素 排序 使 得 QUEUE = a, 
abc, jb， 这 就 是 正确 的 顺序 。 注 意 ， 第 三 次 操作 时 ，@f[ ce] 保持 为 空 ， 因 为 不 在 NONEMPTY[1] 
中 ， 因 此 不 将 CQ[ c] 连 接 到 QUEUE 尾部 。 口 
定理 3.2 算法 3.2 在 时 间 O(1 - m) 内 对 输入 进行 排序 ， 其 中 


laa = XL 

证 明 : 通过 对 图 3-2 的 外 部 循环 操作 次 数 的 简单 归纳 ， 证 明 在 第 i 次 操作 后 ，GUEUE 包含 长 
度 大 于 等 于 1 -i+1 OB, RELL -i+1 到 1 的 元 素 排序 。 这 样 ， 算 法 按 字 典 序 对 它 的 输入 
进行 排序 。 

从 用 时 结果 看 ,算法 的 第 1 部 分 用 Ooa) E, H OC + 1 ) 时 间 排序 它们 。 类 似 
地 ， 第 2 部 分 需要 的 时 间 不 超过 OC Lua) o 

现在 必须 将 注意 力 转向 算法 的 第 3 部 分 和 图 3-2 所 示 的 程序 。 设 n, 是 有 第 ; 个 元 素 的 串 的 数 
量 ,，m, 是 出 现在 串 的 第 i 个 元 素 中 的 不 同 符号 的 数量 ( 即 m, 是 NONEMPTY i] EHE) 。 

考虑 图 3-2 第 3 行 中 i 的 一 个 固定 值 。5 ~7 行 的 循环 需要 的 时 间 为 O(n,), 8 ~ 10 行 的 循环 
需要 的 时 间 为 0(m,)。 第 4 步 需要 的 时 间 为 一 个 常数 ， 因 此 ， 通 过 3 ~ 10 行 的 一 次 操作 需要 的 时 
间 为 O(m, + m) 。 因 此 ， 整 个 循环 需要 的 时 间 为 : 


o( 二 (m, +n,)) 





由 于 


Sm < NL = loa 
可 以 看 到 3 ~ 10 行 需要 的 时 间 为 0(1,)。 由 于 第 1 行 需 要 常数 时 间 ， 第 2 行 需要 的 时 间 为 
O( m) ,就 得 到 了 所 期 望 的 结果 。 口 
下 面 给 出 一 个 例子 ， 说 明 如 何在 算法 设计 中 实现 对 串 进 行 升序 排序 。 
913.2 如 果 能 够 通过 改变 顶点 的 儿子 的 顺序 使 一 棵 树 映 射 为 另 一 棵 树 ， 则 称 这 两 棵 树 是 同 
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构 的 。 考 虑 判断 两 棵 树 7 、 了 是 否 同 构 的 问题 。 以 下 算法 所 需 时 间 与 结 点 数 成 线性 比例 。 算 法 
将 整数 赋 给 两 棵 树 的 结 点 ， 从 第 0 级 的 结 点 开始 ， 向 上 操作 至 根 ， 在 这 种 方式 下 ， 当 且 仅 当 给 它 
们 的 根 赋 同 样 的 整数 时 ， 两 棵 树 是 同 构 的 。 算 法 的 执行 过 程 如 下 : 

1) 给 四 、 丈 的 所 有 叶子 赋值 为 整数 0。 

2) 归 纳 假设 , BEDS T, TES 1-1 28 ES PUR Gs RRB. fni LJ T BUS 1-1 级 的 结 点 
表 ， 该 表 根 据 所 赋 的 整数 值 以 非 递 减 顺 序 排列 ，L, 是 7 的 对 应 表 。? 

3) 通 过 从 左 到 右 扫 描 表 工 并 执行 以 下 操作 给 7 的 第 i 级 非 叶 结 点 赋予 一 个 整数 元 组 : RL 
的 每 个 结 点 v 所 赋值 的 整数 作为 与 v 的 父 结 点 相关 联 的 元 组 的 下 一 个 元 素 。 在 这 一 步 的 最 后 ,1 
中 第 i 级 的 每 个 非 叶 结 点 w 将 有 元 组 (i bos, |) SHARK, Hii, idet w 的 儿子 结 
点 相关 联 的 按 非 递 减 顺序 排列 的 整数 。 设 5, 是 为 7 的 第 i 级 结 点 创建 的 元 组 序列 。 

4) 对 也 重复 步骤 3， 设 5, 是 为 7 的 第 i 级 结 点 创建 的 元 组 序列 。 

5) 用 算法 3.2 HEF S M S, BES, MS, 分 别 为 已 排序 的 元 组 序列 。 

6) 如 果 S, AS, 不 相同 ， 则 停止 执行 且 判 定 树 不 是 同 构 的 。 否 则 ， 将 整数 1 赋值 给 用 S, 的 第 一 
个 不 同 元 组 表示 的 了 T 第 i 级 的 结 点 ， 将 整数 2 赋 给 第 二 个 不 同 元 组 表示 的 结 点 ， 依 此 类 推 。 将 这 些 
整数 赋 给 T 第 i 级 的 结 点 后 ,创建 一 个 赋值 结 点 的 表 工 。 将 TT 第 i 级 的 所 有 叶子 结 点 添加 到 表 工 的 
前 面 。 设 为 与 7 的 结 点 对 应 的 表 。 返 回 步 骤 3， 用 这 两 个 表 给 i+1 级 的 结 点 元 组 赋值 。 
7) 如 果 给 T, 和 7 的 根 赋予 了 相同 的 整数 ， 则 它们 是 同 构 的 。 口 
图 3-4 对 两 棵 同 构 树 的 结 点 进行 整数 和 元 组 赋值 的 结果 。 





图 3-4 同 构 树 算法 的 赋值 


定理 3.3 可 以 在 O(n) 时 间 内 确定 两 棵 有 个 结 点 的 树 是 否 同 构 。 
证 明 : 定理 由 对 例 3.2 的 算法 进行 形式 化 而 得 到 。 算 法 的 正确 性 证 明 略 。 通 过 观察 将 整数 赋 


”必须 确保 能 够 通过 前 序 遍 历 在 0(n) 步 内 进行 级 别 数 赋值 。 
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给 第 i 级 的 结 点 (而 不 是 叶子 ) 的 工作 是 与 i~1 级 的 结 点 数 成 比例 的 ， 从 而 分 析出 运行 时 间 。 将 
所 有 级 的 时 间 相 加 得 到 时 间 0(n)。 将 整数 赋 给 叶子 的 时 间 也 与 4 成 比例 ， 这 样 ， 算 法 所 用 时 间 
为 0(n)。 口 
结 点 都 附 有 标记 的 树 是 标记 树 。 假 设 顶 点 标记 是 1 n 之 间 的 整数 。 如 果 将 每 个 结 点 的 标记 
作为 根据 上 述 算法 赋 给 结 点 的 元 组 的 第 一 个 元 素 ， 就 能 够 在 线性 时 间 内 确定 两 棵 有 个 结 点 的 标 
记 树 是 否 同 构 。 这 样 ， 就 得 到 以 下 推论 。 
推论 判断 两 棵 标记 范围 为 1~n 的 有 n 个 结 点 的 标记 树 是 否 同 构 和 需要 0(n) 时 间 。 


3.3 比较 排序 


这 一 节 考 虑 对 从 线性 序 集合 S 中 抽出 = 个 元 素 进行 排序 ， 其 中 $ 的 元 素 的 结构 未 知 。 用 于 获 
得 关于 序列 的 信息 的 唯一 操作 是 比较 两 个 元 素 。 本 节 先 说 明 任何 基于 比较 的 对 长 度 为 = 的 序列 进 
行 排序 的 算法 至 少 需要 进行 0(nlogn) 次 比较 。 

假设 有 n 个 不 同 的 待 排序 元 素 a,，a,，…，a,。 比 较 排 序 的 算法 可 以 用 1.5 节 描 述 的 决策 树 
表示 。 图 1-18 给 出 了 一 棵 为 a, b, c 排序 的 决策 树 。 在 决策 树 的 某 个 结 点 o 比较 元 素 a 与 元 束 5， 
如 果 a<5， 那 么 分 支 转向 v 的 左 儿子 ， mR oz>5， 那 么 分 支 转向 "的 右 儿 子 。 

通常 ， 基 于 比较 的 排序 算法 限制 一 次 只 能 比较 两 个 输入 元 素 。 但 实际 上 ， 应 用 于 任意 线性 
序 集合 的 算法 并 不 以 任何 形式 与 输入 数据 绑 定 在 一 起 。 因 为 在 一 般 情况 下 ， 对 数据 操作 并 “没有 
意义 ”。 在 任何 情况 下 ， 都 能 确切 证 明 对 个 元 素 进行 排序 的 决策 树 的 高 度 。 

引 理 3. 1 高 度 为 hh 的 二 又 树 最 多 有 2 个 叶子 。 

A: 对 进行 基本 归纳 。 只 需要 注意 ， 高 度 为 h 的 二 叉 树 由 一 个 根 和 至 多 两 棵 子 树 组 成 ， 
每 棵 子 树 的 高 度 最 多 为 h -1。 口 

定理 3.4 任何 排序 nn 个 不 同 元 素 的 决策 树 的 高 度 至 少 为 log nte 

证 明 : 因为 排列 n 个 元 素 可 能 的 结果 是 输入 的 n1 个 排列 中 的 任何 一 个 ， 所 以 决策 树 肯定 至 


Da n! 个 叶子 。 由 引 理 3. 1 可 得 ， 高 度 必须 至 少 为 log n!。 C 
推论 任何 比较 排序 算法 至 少 需 要 enlog n 次 比较 来 排序 n PICK, 其 中 c>0, n 足够 大 。 
A: 对 n>1 

n! 2n(a-1)(-2)- (r1) 2 (7) 
PRU, Xp nz4, logn! z(n/2)log( n/2) =(n/4) log n, 口 


用 斯 特 林 近似 对 n! 进行 更 精确 的 估计 ， 值 为 (n/e)", 所 以 n( logn- log e) 2nlog n - 1. 44n 
接近 排序 n 个 元 素 需 要 的 比较 次 数 的 下 界 ， 是 一 个 令 人 满意 的 近似 值 。 


3.4 堆 排序 一 一 O(n log n) 的 比较 排序 算法 


要 对 长 度 为 n 的 序列 排列 ， 每 个 基于 比较 的 排序 算法 本 质 上 需要 n log n 次 比较 , 很 自然 存 
在 这 样 一 个 疑问 ， 是 否 存 在 只 用 O(n log n) 次 比较 就 能 对 长 度 为 n 的 序列 进行 排序 的 算法 ? 实际 
上 ,前 面 已 经 讨论 过 这 样 的 算法 ， 即 2. 7 节 的 归并 排序 。 另 一 个 这 种 算法 是 堆 排序 ， 除 了 是 有 用 
的 排序 算法 外 ， 堆 排序 使 用 的 有 趣 的 数据 结构 还 有 许多 其 他 用 途 。 

对 堆 排 序 最 好 的 理解 是 考虑 图 3-5 中 的 二 叉 树 ， 它 的 每 片 树叶 的 深度 为 4 或 者 d - 1。 可 用 待 
排序 的 序列 的 元 素 标 记 树 的 结 点 。 堆 排序 重新 安排 树 的 元 素 ， 直 到 与 顶点 相关 的 元 素 大 于 等 于 
与 该 结 点 的 儿子 相关 的 元 素 为 止 。 这 样 的 标记 树 称 为 堆 。 

例 3.3 图 3-5 给 出 了 一 个 堆 。 注 意 ， 从 每 片 叶 子 到 根 的 路 径 上 的 元 素 序 列 是 线性 有 序 的 ， 
子 树 中 的 最 大 元 素 总 是 那 棵 子 树 的 根 。 口 
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堆 排 序 的 下 一 步 是 从 堆 中 移 走 最 大 的 元 素 ， 该 元 素 通常 位 于 根部 。 将 某 片 叶 子 的 标记 
移 到 根 ， 并 将 该 叶子 删除 。 这 样 ， 树 重新 成 为 一 个 堆 ， 
并 重复 这 个 过 程 。 从 堆 移 除 的 元 素 序 列 就 是 已 排 好 序 
的 元 素 序列 (以 降序 排列 ) 。 

对 于 堆 来 说 ， 一 个 方便 的 数据 结构 是 数组 4， 其 中 
4[1] 存 储 根 元 素 ，4[2i] 和 4[2i+1] 存 储 元 素 ALi] POM. 
应 的 顶点 的 左右 孩子 处 的 元 素 ( 如 果 存 在 的 话 )。 例 如 ， 
3-5 中 的 堆 可 用 如 下 数组 表示 : 


可 以 看 出 ， 深 度 最 小 的 顶点 在 数组 中 首先 出 现 ， 深 
度 相等 的 顶点 以 从 左 到 右 的 顺序 出 现 。 

并 不 是 每 个 堆 都 可 以 用 此 方式 表示 。 如 图 3-5 所 示 ， 按 照 树 的 表示 法 ， 最 低层 的 叶子 必须 尽 
可 能 地 靠 左 放置 。 

如 果 用 数组 表示 堆 ， 那 么 堆 排序 算法 的 几 个 操作 是 很 容易 执行 的 。 例 如 ， 在 算法 中 ， 
必须 将 根 元 素 移 除 ， 并 将 这 个 元 素 存 储 到 其 他 地 方 ， 然 后 使 剩 下 的 树 重新 组 成 堆 ， 同 时 移 
去 未 标记 的 叶子 。 我 们 可 以 移 除 堆 的 最 大 元 素 ， 并 通过 交换 4[1] 和 4[n] 来 存储 它 。 然 后 ， 
认为 数组 存储 单元 n 不 再 是 堆 的 一 部 分 。 存 储 单元 n 作为 从 树 删 除 的 叶子 。 为 了 使 树 的 存 
储 单元 1，2，…，n -1 重新 形成 堆 ， 在 加 入 新 的 元 素 4[ 1] 后 ,按照 需要 从 树 根 沿路 径 向 
下 移动 。 接 下 来 重复 这 个 过 程 ， 交 换 4[1] 和 4[n-1]， 并 认为 树 占 据 的 存储 单元 为 1， 
2，…,n -2， 依 此 类 推 。 

例 3.4 以 图 3-5 的 堆 为 例 ， 考 虑 当 交 换 表 示 堆 的 数组 的 第 一 个 和 最 后 一 个 元 素 的 时 候 发 生 
了 什么 。 结 果 数 组 对 应 于 如 图 3-6a 所 示 的 标记 树 。 
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进一步 考虑 排除 元 素 16。 为 了 将 结果 树 转 变 为 堆 ， 将 元 素 4 与 11 交换 ， 即 它 的 两 个 孩子 9 
和 11 中 较 大 的 那个 孩子 11。 

在 新 位 置 ，4 的 孩子 是 10 和 5。 因 为 它们 都 比 4 大 ， 因 此 交换 4 和 它 较 大 的 孩子 10。 
这 样 ， 在 4 的 新 位 置 ， 它 的 孩子 是 1 和 2。 因 为 4 比 它 的 每 个 儿子 都 大 ， 所 以 不 需要 进 一 
步 交 换 。 结 果 堆 如 图 3-6b 所 示 。 注 意 ， 虽 然 元 素 16 已 经 从 堆 中 移 除 ， 它 仍然 存储 于 数 
组 4 的 尾部 。 口 

现在 开始 正式 描述 堆 排序 算法 。 设 o, ，a ，…，o, 是 待 排序 的 元 素 序 列 。 假 设 元 素 在 
数组 4 中 初始 顺序 为 4[ 让 = a;，1 <i<n。 第 一 步 是 创建 堆 ， 也 就 是 说 ,重新 排列 数组 4 中 
的 元 素 以 满足 堆 的 性 质 : 对 1<i<n/2, ALi] 24[2i] ; 对 于 1<i<n/2, HH A[i] z A[2i 
1] 。 过 程 是 由 叶子 开始 逐渐 构建 越 来 越 大 的 堆 。 每 棵 包含 一 片 叶子 的 子 树 形成 一 个 堆 。 如 
果 根 部 元 素 小 于 其 儿子 的 元 素 ， 那 么 高 度 为 的 子 树 通过 将 根部 的 元 素 和 儿子 元 素 中 较 大 
的 那个 进行 交换 来 形成 堆 。 但 这 样 做 可 能 会 破坏 高 度 为 h -1 的 堆 ， 该 高 度 为 h -1 的 堆 需 
要 重新 构建 。 详 细 算 法 如 下 所 示 。 
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a) 图 3-5 的 堆 中 元 素 4 和 16 的 交换 结果 b) 重 构 堆 并 排除 元 素 16 后 的 结果 
图 3.6 
算法 3.3 构建 堆 。 
A: 元 素数 组 AL i] 5 1<i<n, 
输出 : 已 构建 为 堆 的 4 的 元 素 ， 满 足 对 1 <i<n, Ali] <A[i/2]]. 
Ak: 算法 的 核心 是 递归 过 程 HEAPIFY。 参 数 i 和 j 给 出 数组 4 具有 堆 性 质 的 存储 单元 的 范 
围 ， 其 中 i 是 将 要 创建 的 堆 的 根 。 
procedure HEAPIFY(i, j): 


l. if i is not a leaf and if a son of i contains a larger element than i 
does then 
2. let k be a son of i with the largest element; 
3. interchange A [i] and A[k]; 
4. HEAPIFY‘(k, j) 
end 


参数 用 于 确定 i 是 否 为 叶子 和 i 是否 有 一 个 或 者 两 个 孩子 。 如 果 i >j2， 那 么 是 叶子 ， 
HEAPIFY(i, 7) 不 需要 执行 任何 操作 ， 因 为 AL ARB. 
使 所 有 A 具备 堆 的 性 质 的 算法 是 很 简单 的 : 
procedure BUILDHEAP， 
for i«—n? step -1 until 1 do HEAPIFY(i, n) 
接 下 来 ， 我 们 说 明 算法 3.3 在 线性 时 间 内 以 4 构建 一 个 堆 。 
引 理 3.2 如 果 顶 点 i+1, i+2，…, 于 是 堆 的 根 ， 那 么 在 调用 HEAPIFY(i, n), MAR 
i, i+], =, nn 都 将 是 堆 的 根 。 
证 明 : 通过 对 i 向 后 归纳 进行 证 明 。 归 纳 基础 i=n 是 平凡 的 ， 因 为 顶点 n 必须 是 叶子 ,而且 
第 1 行 的 测试 确定 HEAPIFY(n, n) 什么 都 没有 做 。 
对 于 归纳 步骤 ， 要 注意 ， 如 果 顶 点 站 是 叶子 或 者 其 孩子 没有 比 它 大 的 元 素 ， 那 么 根据 以 上 分 
析 ， 就 不 需要 证 明了 。 然 而 ， 如 果 顶 点 宇 有 一 个 孩子 ( 即 2; =m)， 而 且 4[ 引 <4[2 计 ,那么 第 3 
行 的 HEAPIFY 将 交换 4[ i 和 4[2i]。 在 第 4 行 ,调用 HEAPIFY(2i,，n)， 所 以 归纳 假设 意味 着 将 
以 顶点 2i 为 根 的 树 重 构 为 堆 。 顶 点 i+1，i+2,…，2i -1 从 来 没有 停止 作为 堆 的 根 。 因 为 在 数 
组 A 的 新 排列 中 有 ALi] >4[2i] ， 所 以 :为 根 的 树 也 是 堆 。 
同样 ， 如 果 顶 点 i 有 两 个 孩子 ( 即 2i+1<n)， 而 且 4[2i] 和 4[2i+1] 中 较 大 的 一 个 比 4[ 门 
大 ， 如 上 所 示 ， 可 以 知道 在 调用 HEAPIFY(i, n) 后 ， 所 有 的 i，i+1，…，n 会 是 堆 的 根 。 口 


口 





© 实际 上 ， 以 Ln/2 开始 。 
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定理 3.5 算法 3.3 使 4 在 线性 时 间 内 成 为 一 个 堆 。 

证 明 : 使 用 引 理 3.2, 对 1<isn， 可 以 通过 对 i 进行 简单 的 向 后 归纳 说 明 顶 点 i 成 为 堆 
的 根 。 

BTh) EEREN h 的 顶点 上 执行 HEAPIFY 需要 的 时 间 ， 那 么 对 某 个 常数 ce,，T(h) «T (h -1) 
+c, 说 明 T(h) 是 0(h)。 

算法 3. 3 对 每 个 顶点 调用 一 次 HEAPIFY， 排 除了 递归 调用 。 这 样 ，BUILDHEAP 花费 的 时 间 
与 所 有 顶点 的 高 度 总 和 同 阶 。 但 是 ， 最 多 有 「 n/2 ”1 个 顶点 高 度 为 fi。 因此 ，BUILDHEAP 花费 的 
总 时 间 与 


h 
en 
ài 


同 阶 ， 即 O(n), 口 

现在 可 以 完成 堆 排 序 的 说 明 。 一 旦 4 的 元 素 排 序 为 堆 ， 每 次 从 根 移 除 一 个 元 素 。 该 过 程 通 
过 交换 4[1] 和 4[n] ， 并 重新 排列 4[1] ，4[2] ，…，A[n -1] 为 堆 来 实现 。 接 下 来 ， 交 换 4[11 
fl A[n -1]， 并 重新 排列 A[1] ，4[2]，…，4[nm -2] 为 堆 ， 依 此 类 推 ， 直 到 堆 只 包含 一 个 元 素 
为 止 。 到 那个 时 候 ，4[1] ，4[2] ，…，4[ 中 就 是 已 排 好 序 的 元 素 序列 了 。 

算法 3.4 EHF. 

输入 : 数组 元 素 A[ 让 ,1 <i<n。 

输出 : 按 非 递减 顺序 排列 的 A 的 元 素 。 

方法 : 使 用 过 程 BUILDHEAP， 即 算法 3.3。 算 法 如 下 : 


BUILDHEAP; 
for i €— n step —1 until 2 do 
begin 


interchange A[1] and A[i]; 
HEAPIFY(1, i — 1) 
end 
end 口 


定理 3.6 算法 3.4 在 时 间 0(nlogn) 内 排序 nn 个 元 素 。 

证 明 : 通过 对 主 循环 的 执行 次 数 m 进行 归纳 ， 证 明 算法 的 正确 性 。 归 纳 假设 是 在 m 次 迭代 
fa, ln-m+1],，…，,A[n] 包 含 m 个 已 排序 的 最 大 元 素 ( 最 小 元 家 在 前 )， EAL], =, 
4[n -mj] 构 成 堆 。 具 体 的 证 明 留 作 练习 。 执 行 HEAPIFYCI, i) 的 时 间 是 O(logi) 。 因 此 算法 3.4 
的 复杂 度 是 O(n log n), m 

推论 ” 堆 排 序 时 间 复 杂 度 为 O(n log n), 


3.5 快速 排序 一 一 期 望 时 间 为 O( n log n) 的 排序 算法 
到 目前 ， 仅 考虑 了 最 坏 情况 下 的 排序 算法 。 对 许多 应 用 ， 算 法 时 间 复 杂 度 更 实际 的 测量 是 


期 望 运 行 时 间 。 在 决策 树 模 型 下 考察 排序 ， 可 以 看 到 没有 一 个 基于 比较 的 排序 算法 的 期 望 时 间 
复杂 度 能 够 明显 低 于 nlogn。 然 而 ， 对 某 个 常数 <， 确 实 可 以 找到 最 坏 运 行 时 间 为 o, BEMA 
运行 时 间 是 已 知 排序 算法 中 最 好 的 算法 。 本 节 讨 论 的 快速 排序 算法 就 是 这 种 算法 的 一 个 例子 。 


在 讨论 算法 的 期 望 运 行 时 间 之 前 ， 必 须 统 一 输入 的 概率 分 布 。 对 排序 来 说 ， 一 个 自然 的 、 
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也 是 我 们 要 做 的 假设 是 待 排序 序列 的 每 个 排列 在 输入 中 出 现 可 能 性 是 相等 的 。 在 这 个 假设 下 ， 
我 们 能 够 确定 排序 个 元 素 所 需 的 期 望 比较 次 数 。 

一 般 的 方法 是 将 给 定 输入 达到 叶子 v 的 概率 与 决策 树 的 每 片 叶 子 v 联系 起 来 。 如 果 知道 输入 
的 概率 分 布 ， 就 可 以 确定 与 叶子 相连 的 概率 。 从 而 可 以 估算 对 应 特定 排序 算法 的 决策 树 的 所 有 
叶子 的 比较 次 数 的 期 望 值 的 总 生 .p;d;， 其 中 p; 是 到 达 第 i 片 叶 子 的 概率 ，d, 是 它 的 深度 。 称 这 
个 数值 为 决策 数 的 期 望 深度 。 下 面 是 定理 3. 4 的 推广 。 

定理 3.7 在 所 有 nn 个 元 素 的 排列 作为 输入 出 现 的 可 能 性 相等 的 假设 下 ， 排 序 nn 个 元 素 的 决 
策 树 的 期 望 深度 至 少 为 logn!。 

证 明 : 设 D(7T) 是 二 叉 树 了 的 叶子 深度 的 和 。 设 D(m) 是 有 普 片 叶子 的 二 叉 树 了 的 DCT) A 
最 小 值 。 通 过 对 m 做 归纳 ,可 证 明 D( m) zm log mo 

归纳 基础 m=1 是 平凡 的 。 现 在 ,假设 对 所 有 值 小 于 % 的 m 归纳 假设 为 真 ， 考虑 有 上 片 叶 子 
的 决策 树 T。 对 某 个 i,1<i<k, 7 的 根 包括 一 棵 有 i 片 叶子 的 左 子 树 T, MIRA k-i HFK 
AFH T, BA, 

D(T) =i+D(T,) +(k-i) «D(T, ) 

因此 ， 最 小 的 和 可 通过 下 式 给 出 


D(k) =MIN[k + D) + D(k - i)] (3-1) 
使 用 归纳 假设 ， 从 式 (3-1) 可 以 得 到 
D(k) >k+MIN[i log i + (k -i)log(k - i) ] (32) 


容易 看 出 最 小 值 出 现在 ;= k/2 处 。 这 样 ， 
D(k) =k +k log t log k 


由 此 得 到 ， 对 所 有 mz, D(m) zmlogm, 

现在 说 明 排序 ”个 随机 元 素 的 决策 树 了 有 至 少 m! HF. IR, n! 片 叶 子 的 概 
率 都 为 1/n!， 剩 下 的 叶子 的 概率 为 零 。 对 于 祖先 皆 是 概率 为 0 的 叶子 顶点 的 顶点 ， 可 以 将 
其 从 了 移 开 ， 这 并 不 会 改变 了 的 期 望 深度 。 这 样 ， 剩 下 的 是 一 棵 树 了 '， 有 ml! HEF, 每 
片 叶子 的 概率 为 1/n!。 因 为 DC(T') 2n! log n!， 所 以 T'( 即 7) 的 期 望 深度 至 少 为 (1/n1) 
n! logn! =logn!, m 

推论 ”每 次 比较 排序 平均 至 少 需要 进行 cnlog ”次 比较 ， 其 中 是 常数 。 

有 必要 提 及 一 种 称 为 快速 排序 的 有 效 算法 。 虽 然 其 期 望 运 行 时 间 的 下 限 是 cnlogn， 其 中 c 是 
常数 。 但 当 运 行 在 实际 的 机 器 上 时 ， 它 的 期 望 运行 时 间 与 已 知 的 其 他 基于 比较 的 算法 的 运行 时 
间 成 比例 。 快 速 排序 算法 有 最 坏 情况 的 运行 时 间 ， 它 是 二 次 的 ， 但 这 对 很 多 应 用 并 不 重要 。 

算法 3.5 快速 排序 。 

输入 : n 个 元 素 的 序列 $S,， a, a, s, a,o 

输出 : S 的 有 序 排列 元 素 。 

方法 : 使 用 图 3-7 中 定义 的 递归 过 程 QUICKSORT。 算 法 包括 对 QUICKSORT(S) MIA. O 

定理 3.8 算法 3.5 在 O(nlogn) 的 期 望 时 间 内 对 nn 个 元 素 的 序列 进行 排序 。 

证 明 : 算法 3.5 的 正确 性 可 通过 直接 对 $ 的 规模 进行 归纳 证 明 。 为 简单 起 见 ， 在 时 间 分 析 
中 ， 假 设 $ 的 所 有 元 素 都 是 不 同 的 。 这 个 假设 将 会 使 在 行 3 构建 的 5, 和 5; 的 规模 最 大 化 ， 并 因此 
使 花费 在 行 4 的 递归 调用 的 平均 时 间 最 大 化 。 设 T( n) 是 QUICKSORT 排序 ”个 元 素 的 序列 所 需要 
的 期 望 时 间 。 显 然 ，7(0) =T(1) =b, HH b BHR. 
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procedure QUICKSORT(S): 
if S contains at most one element then return 5 
else 


choose an element a randomly from S$; 

let 5,, S,, and S, be the sequences of elements in 9 less 
than, equal to, and greater than a, respectively; 

return (QUICKSORT(S,) followed by S, followed by 
QUICKSORT(S;)) 







end 





图 3-7 快速 排序 程序 


假设 在 行 2 中 所 选择 的 元 素 a 是 n 个 元素 的 序列 5 的 第 i 小 元 素 。 那 么 , 行 4 的 两 个 递归 调 
用 的 期 望 时 间 分 别 是 T(i-1) 和 7T(n ~- 让。 因为 i 在 1 和 n 之 间 的 取 值 可 能 性 是 相同 的 ,而 
QUICKSORT( S) 的 平衡 显然 需要 时 间 cn, HH e 是 一 个 常数 。 因 此 有 关系 : 


Mn) < on+ LY UG -1) «TQ 2] Fn 22 (3-3) 
对 式 (3-3 ) 进 行 代 数 推导 可 得 
T(n) <on+2¥ T(i) (34) 
n 720 


下 面 将 证 明 ， 当 n>2 时, T(n) Skanna, HP kz2c «2b, WA, bz T(0) = 了 (1)。 对 于 归纳 基 
fl n-2, T(2) «2c «2b 显然 符合 式 (34) 。 对 于 归纳 步 ， 将 式 (34) 写 为 


T(n) «as 2 y uni (3-5) 
n n iz 
因为 ini EM EAA, BAS BOUES] 
Dilis f Inad s- (3-6) 
用 式 (3-6) 代 替 式 (3-5) ， 可 得 
T(n) <en 3. Inn - # (3-7) 


因为 n>2 Wk =2c +2b5， 可 以 得 出 cn +4b/n<in/2, XF, ABER (3-7) A WB T(n) skn, O 
实际 上 还 应 该 考虑 两 个 细节 。 首 先是 在 QUICKSORT 8547 2“ 随机 ?选择 元 素 a 的 方法 。 执 行 
者 可 能 为 了 简单 总 是 选择 序列 S 的 第 一 个 元 素 。 这 个 选择 会 使 QUICKSORT 的 性 能 比 使 用 方程 式 
(3-3) 差 很 多 。 通 常 ， 传 给 排序 程序 的 序列 是 在 “一 定 程度 上 ”已 经 排 好 序 的 ， 所 以 第 一 个 元 素 的 
值 比较 小 的 概率 高 于 平均 概率 。 作 为 一 个 极端 的 例子 ， 读 者 可 以 验证 ， 如 果 QUICKSORT 对 已 经 
排序 好 的 不 包含 相同 元 素 的 序列 进行 排序 时 ， 假 设 行 2 总 是 选择 5 的 第 一 个 元 素 gc， 那么 序列 S, 
包含 的 元 素 总 是 比 $ 少 一 个 。 在 这 种 情况 下 ，QUICKSORT 的 步 数 代价 是 二 次 的 。 

在 行 2 选择 元 素 a 的 更 好 的 方法 是 使 用 一 个 随机 元 素 产 生 器 产生 一 个 整数 i, sisl SIS, 
SRB, FES 中 选择 第 i 个 元 素 作 为 划分 元 素 a。 简 单 些 的 方法 是 从 5 中 选择 一 个 元 素 样 本 ， 然 后 
使 用 元 素 样本 的 中 位 数 作为 划分 元 素 。 例 如 ， 选 择 5 的 第 一 个 元 素 、 中 间 元 素 以 及 最 后 一 个 元 素 
的 中 位 数 作为 划分 元 素 。 

第 二 个 细节 是 怎样 有 效 地 将 S 划分 为 S$, 、5, 和 5, 三 个 序列 。 使 数组 4 拥有 所 有 个 初始 元 素 
是 可 能 的 也 是 所 期 望 的 。 因 为 QUICKSORT 递归 地 调用 自身 ， 它 的 变量 S 总 是 在 连续 的 数组 项 
"P, AeA ALS], ALF*1], =, ALI], 1<f<1<n。 选 择 “ 随 机 "元素 a 后 ， 可 以 适当 地 划分 


O 用 1 S51 表示 序列 5 的 长 度 。 
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5。 也 就 是 说 ， 能 够 将 SEIAS], Alf+1], =, ACE]; SUS,EESIALE +1], A[E *2], 
ALI], RAP k(fksl). BA, WRA, SUSARA, (ERE S, 和 S, U S; 中 的 一 个 
为 空 ， 否 则 对 于 S, 和 5, U5;， 简 单 地 递归 调用 QUICKSORT 更 有 效 。 

也 许 适 当 划 分 S 的 最 简单 方法 是 用 两 个 指针 指向 数组 i 和 j。 开 始 时 ,i =f, MALS 
4[i-1] 始 终 包含 5 的 元 素 。 类 似 地 ， 最 初 j =1， 从 4[j+1] 到 4[ 疏 始终 包含 着 S USHER. 
图 3-8 是 执行 划分 的 程序 。 


begin 
icf, 
jet 
while i < j do 


while A[j] = a andj = fdoej —j— 1; 
while 4(i] < a and i s l do i | i+ 1; 
if i < j then 


begin 
interchange A [i] and A [j); 
ic i-^l 
jej-r 





图 3-8 适当 划分 3 为 3 和 SUS; 


划分 后 ， 对 数组 4A[ 几 到 ALL 1] B S 和 数组 4[7+1] 到 4[ 门 即 $. US, ， 递 归 调 用 QUICK- 
SORT。 然 而 ， 如 果 i=f 即 5, = 名， 必须 首先 从 S U5, 移 除 至 少 一 个 a 的 实例 ， 而 移 除 按 其 进行 
划分 的 元 素 是 很 方便 的 。 应 当 注意 ， 如 果 这 个 数组 用 来 表示 序列 ， 就 能 够 通过 简单 地 传递 指针 给 
QUICKSORT 作为 参数 ， 其 中 指针 指向 所 使 用 的 部 分 数组 的 第 一 个 和 最 后 的 存储 位 置 。 

例 3.5 用 元 素 a=3 划分 数组 4 


stots} fir fs [ss] 
474 的 while 语句 使 ) 从 初 值 9 下降 为 ?， 因 为 4[9] 3m — 9 和 elt 


A[8] =8 都 大 于 或 等 于 a, 但 4[7] =1 <a, i 的 初 值 为 1， 

因为 4[1] =6>a, PIT 5S 没有 从 初 值 1 增加;i 的 值 。 因 b 

此 ,交换 4[1] 和 A[7]， 令 i 值 为 2, j 值 为 6， 这 样 留 下 图 TEREE 
3-9a 所 示 的 数组 。 执 行 3 ~ 9 行 循环 两 次 之 后 的 结果 如 图 4 


j 
3-9b 和 图 3-9c 所 示 。 此 时 i>j, 473 的 while onn o [12T TSTS D TeTs]3] 
完毕 。 j i 
3.6 顺序 统计 学 图 3-9 数组 的 划分 
和 排序 密切 相关 的 一 个 问题 是 在 = 个 元 素 的 序列 中 选择 第 大 小 的 元 素 .9 一 个 显然 的 解决 方法 





O 严格 地 讲 ， 序 列 a ，a ，…，an 的 第 大 小 的 元 素 是 序列 中 的 元 素 5， 有 最 多 上 -1 Mifta <b, EEDA k 
^r iE a sb. Din, 4 是 序列 7，4，2，4 的 第 二 和 第 三 小 的 元 素 。 
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是 排序 序列 为 非 递 减 序 ， 然 后 定位 第 个 元 素 。 正 如 我 们 看 到 的 ， 这 需要 mlogn 次 比较 。 通 过 细 
心 应 用 分 治 策略 ， 可 以 用 0(n) 步 找到 第 & 小 的 元 素 。 一 个 重要 的 特殊 例子 是 ， 当 =「n/2 1 时， 
可 以 在 线性 时 间 内 找到 一 个 序列 的 中 位 数 。 

算法 3.6 查找 第 小 元 素 。 

输入 : 从 一 个 线性 序 的 集合 中 所 抽取 的 n 个 元 素 的 序列 和 一 个 整数 k，1 <hk<n。 

输出 :5S 中 第 上 小 的 元 素 。 

方法 : 使 用 图 3-10 的 递归 过 程 SELECT。 口 

















procedure SELECT(k, 5): 
1. M |S| < 50 then 


begin 
2. sort $; 
3 return kth smallest element in S 


4 divide S into ||S|/5j sequences of 5 elements each 

5. with up to four leftover elements; 

6. sort each 5-element sequence; 

7. let M be the sequence of medians of the 5-element sets; 
8 m +- SELECT([IM1/2], M); 

9 let S,, 5,, and S, be the sequences of elements in S less 

than, equal to, and greater than m, respectively; 

10. if |S,| = k then return SELECT(K, 5,) 





else 
11. M (Si + 15,| = k) then return m 
12. else return SELECT(k — |S,| — i54. S3) 
end 


图 3-10 选择 第 上 小 元 素 的 算法 


直观 地 检验 一 下 算法 3. 6， 看 它 为 什么 有 效 。 基 本 的 想法 是 根据 某 个 元 素 m 将 给 定 序列 划分 
为 三 个 序列 5S,、5, 和 $; ， 使 得 5, 包 含 所 有 小 于 m 的 元 素 ，5, 包 含 所 有 等 于 m oC, S, QUALI 
有 大 于 mm 的 元 素 。 通 过 计算 ,和 $.: 中 的 元 素数 量 ， 能 够 确定 第 大 小 的 元 素 在 5,、5, 还 是 SH, 
这 样 ， 可 以 用 一 个 小 一 点 的 问题 代替 给 定 的 问题 。 

为 了 得 到 一 个 线性 的 算法 ， 必 须 能 够 在 线性 时 间 内 找到 划分 元 素 ， 使 子 序 列 S, 和 ,的 大 小 
不 会 大 于 S 的 大 小 的 固定 比例 值 。 技 巧 就 在 于 怎样 选择 划分 元 素 m。 将 序列 S 划分 为 每 个 有 5 个 
元 素 的 子 序列 。 排 序 每 个 子 序列 ， 用 每 个 子 序 列 的 中 位 数组 成 序列 M; WE M 仅 包 含 Ln/5 个 元 
素 ， 可 以 找到 它 的 中 位 数 ， 比 在 = 个 元 素 序 列 中 执行 该 操作 要 快 5 倍 。 

此 外 ，S 中 至 少 四 分 之 一 的 元 素 小 于 或 者 等 于 m; 至 少 四 分 之 一 的 元 素 大 于 或 者 等 于 m。 这 
可 以 由 图 3-11 说 明 。 问 题 出 现 了 ， 为 什么 是 “神奇 数字 ”5? 答案 是 有 两 个 SELECT 的 递归 调用 ， 
每 一 个 都 基于 大 小 为 S 的 一 个 比值 的 序列 。 为 了 使 算法 运行 时 间 为 线性 ， 两 个 序列 的 长 度 和 必须 
小 于 1 SI 。 除 了 5， 其 他 数 也 可 以 ， 但 是 ， 对 某 些 数 ， 排 序 子 序列 的 代价 很 高 。 确 定 卿 些 数 适 
合 于 取代 5 留 作 习题 。 

定理 3.9 算法 3.6 在 O(n) 时 间 内 找到 nn 个 元 素 的 序列 S 的 第 天 小 元 素 。 

证 明 : 算法 的 正确 性 可 对 5 的 大 小 直接 进行 归纳 证 明 ， 这 部 分 的 证 明 留 作 练 习 。 设 T(n) 为 
从 大 小 为 n 的 序列 中 选择 第 小 元 素 需 要 的 时 间 。 中 位 数 序列 MM 的 大 小 最 多 为 n/5， 这 样 ， 递 归 
调用 

SELECT(T | M! /21, M) 
至 多 需要 T(n/5) 时 间 。 
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[. 已 知 小 于 等 于 m 的 元 素 


pepe ot t ot ot t t 


| 
o ed le JEN e! © o o 已 排 序 的 序列 M 
TG 

- , 


S 
已 知 大 于 等 于 严 的 元 素 sj 


图 3-11 采用 算法 3.6 对 3 分 区 


序列 S 和 $, 的 大 小 最 多 为 3n/4。 注 意 ， 至 少 用 的 Ln/10 | 个 元 素 大 于 或 等 于 m， 对 于 这 些 元 
素 至 少 有 两 个 是 一 样 大 的 不 同 元 素 。 这 样 ，5, 的 大 小 最 多 是 n 73 | n/10]， 其 中 当 n>50 RE, 小 
于 3n/4。5, 与 之 类 似 。 这 样 ， 行 10 或 行 12 的 递归 调用 最 多 需要 7(3n/4) 时 间 。 所 有 其 他 语句 最 
多 需要 0(n) 时 间 。 因 此 ， 对 某 个 常数 <， 我 们 有 


T(n) cn 34 n<49 时 
T(n) &T(n/5) +T(3n/4) +en M nz50 时 (3-8) 
由 式 (3-8) ， 通 过 对 进行 归纳 ， 可 证 明 T(n) <20en, 口 


3.7 顺序 统计 的 期 望 时 间 


这 一 节 将 考虑 在 个 元 素 的 序列 中 选择 第 上 小 元 素 的 期 望 时 间 。 我 们 将 会 看 到 在 最 坏 情 况 下 
和 在 期 望 时 间 情 况 下 查找 第 小 的 元 素 至 少 需要 n -1 次 比较 。 这 样 ， 根 据 决策 树 模 型 ， 上 一 节 
给 出 的 选择 算法 在 常数 因子 下 是 最 优 的。 这 一 节 将 给 出 另 一 个 选择 算法 ， 它 在 最 坏 情况 下 的 操 
作 是 二 次 的 ， 但 是 期 望 时 间 与 算法 3. 6 成 比例 。 

设 $= la，a，…，a| 是 nm 个 不 同 元 素 的 集合 。 设 了 是 查找 $ 中 第 k 小 元 素 算法 的 决策 树 。 
7 了 中 的 每 条 路 径 p 定义 了 S 的 一 个 关系 R,， 如 果 在 p 的 某 个 顶点 比较 两 个 不 同 元 素 a Ma, wE 
结果 是 a, < a 或 者 a,<a,, WA a Ra, PUER; 是 关系 RR 的 传递 闭 包 。 直观 上 ， 因 为 没有 元 素 与 
自己 做 比较 ， 如 果 aR a, RARE p 代表 的 比较 序列 确定 了 a, < w。 

引 理 3.3 MRK p 确定 元 素 a, Æ S 中 第 小 的 元 素 ， 那 么 对 每 个 izm, 1 <i<n, 
aR; a, S a, RJ aio 

证 明 : 假设 对 于 关系 R* ， 某 个 元 素 ,与 ec。 无 关 ， 通 过 对 S 中 以 线性 序 将 a, 放 于 c。 的 后 面 
或 前 面 ， 可 以 证 明 ， 与 路 径 p 已 经 正确 地 确定 a, 是 5 中 第 小 的 元 素 的 假设 是 矛盾 的 。 设 S, = 
fa l oR al ，3 = {a;1 a Rjal, SES 中 剩 下 的 元 素 。 通 过 假设 ,a, 和 a 在 5, 中 。 

WR a 是 5, 中 的 任意 元 素 ( 相 应 地 ，5,)， 而 且 aR? a,( 相 应 地 ，a,R*a,) ， 通 过 传递 性 ，a, 也 
在 5 中 (相应 地 ，5,)。 这 样 ， 可 以 构建 一 个 与 RR 相 一 致 的 线性 顺序 R, 6818 $, 中 的 所 有 元 素 都 
在 5; 中 的 所 有 元 素 之 前 ，5, 中 的 元 素 在 5, 中 所 有 元 素 之 前 。 


O ”回顾 假设 < 和 4 的 每 次 比较 ， 结 果 是 a。<5 或 者 b<a。 如 果 a; <a, 那么 sj 和 的 比较 结果 是 ei aj. 如果 a 所 
aj, 那么 afl ai 的 比较 结果 是 a; SG;o 

O 关系 RR 的 传递 闭 包 是 关系 R* ,通过 cR:d 定义 ， 当 且 仅 当 存在 序列 eí Re; , ej Res, on, en, Re, HP mez2, 
c=@ 和 d=e,。o ' 
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由 假设 ,对 于 R/, a 58 9 中 的 任何 元 素 无 关 。 假 设 在 这 个 线性 序 尺 中 ，a, 在 o zc BU, BD 
a,Ra,,。 那 么 可 以 找到 一 个 新 的 线性 序  ， 除 了 将 a, 移 到 a 后面， 作为 a, 的 直接 后 继 ， 它 与 RR 相 
Eo RES R 一 致 。 对 每 个 R 和民 ， 可 以 发 现 a 的 不 同 的 整数 值 以 分 别 满足 R 或 者 R。 但是， 
a, 不 能 是 两 种 情况 下 的 第 小 元 素 ， 因 为 a 在 R 中 比 在 R 中 的 位 置 靠 前 一 个 元 素 。 这 样 可 以 得 
出 结论 ， 如 果 对 于 R; ，5 中 的 某 个 元 素 与 o LK, HEAT BUR ER S 中 正确 地 选择 第 个 元 
Ko MPF a,,Ra,， 可 以 对 称 地 处 理 。 口 

定理 3. 10 如 果 了 是 一 棵 在 集合 S 中 选择 第 上 小 元 素 的 决策 树 ， 上 SI =n, MATHER 
叶子 的 深度 至 少 为 n -1。 

证 明 : 考虑 T 中 从 根 到 叶子 的 路 径 p。 通 过 引 理 3. 3， 对 每 个 im， aR a RA aR ya， 其 
中 将 a ANB kR. MICK a, ixm, XL ai 定义 关键 比较 为 p 上 包括 a WEER, WE 
下 述 之 一 : 

1.a, 与 ca WR; 

2. a 与 o 比 较 ， a,R,a,# aR, a, ; 

a 与 a, EE, a;R,a, fll anR aj; 

Mae ee. w 的 关键 比较 是 第 一 次 比较 ， 根 据 它 能 够 最 终 确 定 a 在 a, 之 前 或 者 之 后 。 

ER, RT o。， 每 个 元 素 都 有 关键 比较 ， 否 则 既 没有 aR; a (BUB a,R*a,。 而 且 容易 看 
出 两 个 被 比较 元 素 间 的 比较 不 会 是 关键 比较 。 因 为 必须 有 - 1 个 元 素 包 含 在 关键 比较 中 ， m 
BRE p 的 长 度 必须 至 少 为 n -1。 

引 理 在 5S 中 找到 第 k 小 元 素 , 不 管 在 期 望 情况 下 还 是 最 坏 情况 下 ， 都 至 少 需要 n -1 " 
比较 。 

实际 上 ， 对 所 有 k， 除 了 1 或 mw， 可 以 证 明 比 定理 3. 10 更 强 的 结果 。 见 习题 3.21 ~3.23。 

要 在 $ 中 寻找 计算 第 小 元 素 的 好 的 期 望 时 间 的 算法 ， 类 似 快速 排序 的 策略 是 适用 的 。 

算法 3.7 AMA NTH. 

A: 从 线性 序 和 中 抽出 的 = 个 元 素 的 序列 S 和 整数 k，1 <k<n。 

输出 : S 中 的 第 小 元 素 。 

方法 : 使 用 图 3-12 所 示 的 递归 过 程 SELECT。 C 


procedure SELECTK, 5): 
if |S| = 1 then return the single element in S 
else 


begin 
choose an element a randomly from 5; 
let S,, 5,, and S, be tbe sequences of elements in 5 less 
than, equal to, and greater than a, respectively; 
if |S,| = k then return SELECT(k, 5,) 
else 


if |S,| + [S] = k then return 
else retarn SELECT(k — Isl — 1511. Ss) 
end 





3-12 ”选择 算法 


定理 3. 11 算法 3.7 具有 线性 的 期 望 运 行 时 间 。 

WES): BE T(n) 是 对 n 个 元 素 序列 执行 SELECT 的 期 望 运 行 时 间 。 为 了 简化 ， 假 设 $ 中 所 有 
元 素 都 不 同 。( 如 果 有 重复 元 素 ， 结 果 并 不 会 改变 。) 

假设 行 2 选择 的 元 素 “ 是 S 中 第 i 小 的 元 素 ， 那么 i TES, 2, =, n 中 任意 一 个 元 素 的 
概率 是 相同 的 。 如 果 i>k， 则 对 i -1 个 元 素 的 序列 调用 SELECT; 如 果 i<k， 则 对 n -i 个 元 素 的 
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序列 调用 SELECT, ER, $4 或 者 行 6 的 递归 期 望 代价 是 | 
+f 号 ro -i) + ET -1)] = LATO + Zro) | 
过 程 SELECT 剩 下 的 部 分 需要 时 间 en, He 为 常数 ， 所 以 ， 对 nz>2， 有 以 下 不 等 式 
T(n) <cn+ max{ + [5 ro + $00 ] ] (3-9) 
读者 可 使 用 归纳 法 作为 练习 自行 证 明 : WME T) <c， 那 么 对 所 有 n22, T(n) <4en, O 
习题 
3.1 用 算法 3. 1 排序 字符 串 abe, ach, bea, bbc, acc, bac, baa, 


3.2 用 算法 3. 2 排序 字符 串 a, be, aab, baca, che, cc, 
3.3 根据 例 3. 2 测试 图 3-13 中 的 两 棵 树 是 否 同 构 。 


图 3-13 PRH 


3.4 ”排序 表 3, 1, 4, 1,5, 9, 2, 6, 5, 3, 5, 8, 9, 7， 请 分 别 使 用 (a) 堆 排序 (b) 快 速 排 序 
和 (c) 归 并 排序 (算法 2.4)。 每 种 情况 需要 比较 几 次 ? 
3.5 考虑 以 下 排序 存储 在 数组 4 中 的 元 素 序 列 ec a, ，…，c, 的 算法 。 也 就 是 说 ，4[ 让 = ai， 
(1 和 ;和 nn) 。 
procedure BUBBLESORT(A): 
for j= n — 1 step — 1 until 1 do 
for i= 1 step 1 until j do 
if A{i+ 1} < A[i] then interchange A[i] and A(i + 1] 
a) uEB] BUBBLESORT 按 非 递减 次 序 对 4 中 的 元 素 进 行 排序 。 
b) 确 定 BUBBLESORT 的 最 坏 情况 运行 时 间 和 期 望 运行 时 间 。 
3.6 完成 能 够 在 线性 时 间 内 进行 建 堆 的 证 明 。( 定 理 3.5) 
3.7 ”完成 堆 排序 需要 O(n log n) 的 时 间 的 证 明 。( 定 理 3.6) 
3.8 说 明快 速 排序 在 最 坏 情 况 下 的 运行 时 间 是 O(n^). 
3.9 找 第 大 小 元 素 的 算法 3.7 在 最 坏 情况 下 的 运行 时 间 是 什么 ? 
*3.10 通过 完成 定理 3.7 的 证 明 以 及 解 方 程 (3-2) ， 证 明 排 序 个 元 素 的 期 望 时 间 下 界 是 cnlogn， 
其 中 c 为 常数。 
3.11 通过 解 方程 (3-8) 完 成 算法 3. 6 在 0(n) 时 间 内 找到 第 小 元 素 (定理 3.9) 的 证 明 。 
*3.12 证明 图 3-8 分 割 程 序 的 正确 性 ， 并 且 分 析 它 的 运行 时 间 。 
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3. 13 
*3. 14 


*3. 15 


3.16 


3.17 


* 3. 18 


3. 19 


* 3. 20 


** 3, 21 


** 3.22 


** 3. 23 


*& 3. 24 


* 3. 25 


通过 解 方程 (3-9) 证 明 找 第 下 小 元 素 的 算法 3. 7 的 期 望 时 间 是 O(n) (定理 3.11)。 

说 明 算法 3.7 用 的 比较 次 数 的 期 望 值 最 多 是 4n。 如 果 知 道 算法 用 到 的 大 值 ， 能 否 改进 这 个 
界限 ? 

设 5 是 元 素 序列 ， 其 中 第 i 个 元 素 有 m; 个 副本 ，1 <i<k。 设 n= Eim, 证 明 车 用 比较 排 
序 对 5 进行 排序 ， 


! 

O(n +log( = ml xi) 
次 比较 是 必要 和 充分 的 。 
设 5,，5,，…，5, 是 1~n 范围 内 的 整数 集合 ， 所 有 5, 的 势 的 和 是 n。 描 述 一 个 排序 所 有 S, 
的 0(n) 的 算法 。 
给 定 序列 a, a, =, a EIN r(1) ，7r(2) ，…，T7(n) ， 编 写 简化 ALGOL 算法 ， 重 新 
原 地 安排 序列 ， 使 得 顺序 为 ac Opa). os Anno 算法 的 最 坏 情 况 运行 时 间 和 期 望 运 行 
时 间 是 多 少 ? 
在 构建 大 小 为 2 -1 的 堆 时 ， 可 构建 两 个 大 小 为 2! -1 的 堆 ， 再 组 合 起 来 ， 添 加 根 并 将 
根 处 的 元 素 由 根 向 下 放 到 适当 的 位 置 。 由 此 ， 可 以 简单 地 通过 一 次 增加 一 个 元 素 作为 新 
叶子 ， 将 新 元 素 向 上 推 以 添加 到 树 上 的 方式 来 构建 一 个 堆 。 写 一 个 通过 一 次 添加 一 个 叶 
子 构建 堆 的 算法 ， 并 与 算法 3. 3 比较 渐 近 增长 率 。 
考虑 矩形 数组 。 将 每 行 的 元 素 按 升序 排序 。 然 后 将 每 列 元 素 按 升序 排序 。 证 明 每 行 元 素 仍 
然 有 序 。 
BWa,, ，o ，…，ow, 是 一 个 元 素 序列 ， 设 p，9 是 正 整数 。 考 虑 选择 每 隔 p 的 元 素 形成 的 子 
序列 。 排 序 这 些 子 序列 。 对 g 重复 这 一 过 程 。 证 明 距 离 为 p 的 子 序列 仍然 有 序 。 
考虑 用 比较 的 方法 从 nn 个 元 素 的 集合 中 查找 最 大 和 次 大 元 素 。 证 明 n +f loga] -2 次 比较 
是 必要 的 和 充分 的 。 
ERE n 个 元 素 的 序列 中 查找 第 上 小 元 素 所 需 的 期 望 比较 次 数 至 少 为 (1 +0.75@(1 - a) )m， 
其 中 a=k/n， Hpk An BERK, 
说 明 在 个 元 素 的 集合 中 找到 第 小 元 素 ， 在 最 坏 情况 下 n+ MIN(E, n-k+1) -2 次 比 
较 是 必需 的 。 
设 $ 是 n 个 整数 的 集合 。 假 设 只 能 执行 5 中 元 素 相 加 以 及 和 的 比较 。 在 这 种 情况 下 ， 找 到 
S 的 最 大 元 素 需 要 多 少 次 比较 ? 
算法 3. 6 将 序列 分 割 为 规模 为 5 的 子 序列 。 算 法 对 其 他 规模 如 3, 7 和 9 是 否 也 可 行 ? 选 
择 使 得 比较 总 次 数 最 小 的 子 序 列 规模 。 图 3-14 指出 排序 不 同 规模 集合 的 已 知 最 少 比较 次 
数 。 对 ms 和 12， 图 中 所 示 的 比较 次 数 是 已 知 最 优 的 。 


wants | a] a] als] sol sf oheja] 12] 9] 4] 15 | 
sen [o c [s | s[ Diol lied oo] [o] sa |o] sz sef so 


图 3-14 排序 ”个 元 素 的 已 知 最 少 比较 次 数 PA 


算法 3. 5 将 序列 分 为 长 度 为 5 的 子 序列 ， 找 到 每 个 子 序列 的 中 位 数 ， 并 找到 这 些 中 位 数 的 
中 位 数 。 除 了 找到 中 位 数 的 中 位 数 ， 寻 找 某 个 其 他 元 素 ， 如 第 L k/5 个 元 素 是 否 更 高 效 ? 
考虑 以 下 排序 方法 。 以 包含 一 个 元 素 的 序列 开始 ， 通 过 折 半 查找 一 次 插入 剩 下 的 一 个 元 
素 。 设 计 一 个 可 以 快速 进行 折 半 查找 和 插入 元 素 的 数据 结构 。 是 否 可 以 在 0(nlogn) 时 间 


内 实现 这 种 排序 ? 


**3.28 ”除了 选择 一 个 随机 元 素 分 割 规模 为 的 集合 外 ， 如 快速 排序 或 者 算法 3.7 所 做 的 ， 还 可 以 


选择 一 个 规模 为 s 的 小 样本 ， 找 到 它 的 中 位 数 ， 利 用 中 位 数 来 分 割 整个 集合 。 说 明 如 何 选 
PE ;作为 n 的 函数 ， 使 排序 所 需 的 期 望 比较 次 数 最 小 。 
**3.29 扩展 习题 3.28 的 思想 ， 使 顺序 统计 问题 所 需要 的 比较 次 数 最 小 。[ 提示: 从 样本 集合 中 选 
择 两 个 元 素 ， 这 两 个 元 素 具 有 较 高 的 跨越 所 需 元 素 的 概率 。] 
3.30 ”如 果 相 等 元 素 排 序 后 的 顺序 与 排序 前 相同 ， 则 排序 方法 是 稳定 的 。 下 列 哪些 排序 算法 是 稳 
定 的 ? 
a) 骨 泡 排序 (习题 3. 5) 
b) 归 并 排序 (算法 2.4) 
c) 堆 排序 (算法 3. 4) 
d) 快 速 排序 (算法 3.5) 


研究 性 问题 


3.31 在 特定 情况 下 所 和 需 的 比较 次 数 有 一 些 开放 问题 。 例 如 ， 希 望 从 个 元 素 的 集合 中 查找 第 
INER. Pratt 和 Yao[ 1973] 已 经 讨论 过 上 z3 TRL. XT n TOUR, n213, W 3-14 给 出 
的 数值 是 否 最 优 尚 是 未 知 的 。 对 比较 小 的 n，Ford 和 Johnson [ 1959 ] 提出 的 排序 算法 在 比 
较 次 数 上 是 最 优 的 。 


文献 及 注释 


Knuth[ 1973a] 概述 了 排序 方法 。 堆 排序 由 Williams[ 1964 ] 提出 ， 由 Floyd[ 1964 ] 改进 。 快 速 
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Rivest 和 Tarjan[ 1972] 提出 的 。Hadian 和 Sobel[ 1969 ] 以 及 Pratt 和 Yao[ 1973] 讨论 了 查找 特定 的 
顺序 统计 值 的 比较 次 数 。 

习题 3. 21 的 结果 可 参见 Kislitsyn [ 1964], 。 习 题 3.22、3.23 和 3.29 来 自 Floyd 和 Rivest 
[1973 ] ， 该 文献 还 包括 了 一 个 比 习题 3. 22 所 阐述 的 更 强 的 下 限 。 习 题 3. 19、3. 20 和 一 些 推广 在 
Gale 和 Karp[ 1970] 和 Liu[ 1972 ] 中 有 所 讨论 。 排 序 的 一 个 有 趣 的 应 用 是 在 平面 上 查找 点 集合 的 凸 
包 ， 它 由 Craham[ 1972] 提 出 。Horvath[ 1974] 则 讨论 了 稳定 算法 。 





第 4 章 集合 操作 问题 的 数据 结构 


对 于 给 定 问 题 ， 探 讨 有 效 算法 设计 的 一 个 较 好 方式 是 研究 问题 的 基本 性 质 。 通 常 ， 一 个 问 
题 可 以 表述 为 集合 等 基本 数学 对 象 ， 该 问题 的 算法 可 以 依据 基于 这 些 基 础 对 象 的 基本 操作 来 描 
述 。 这 种 观点 的 优势 在 于 ， 通 过 研究 各 种 数据 结构 ， 选 择 在 整体 上 最 适合 于 问题 的 算法 。 因 此 ， 
好 的 数据 结构 设计 能 设计 好 的 算法 。 

本 章 研究 集合 的 7 个 基本 操作 ， 这 些 操 作 是 许多 查找 和 信息 检索 等 问题 特有 的 。 本 章 介绍 
表示 集合 的 多 种 数据 结构 ， 并 考虑 在 需要 执行 一 系列 不 同类 型 的 操作 时 ， 每 种 结构 的 适用 性 。 


4.1 集合 的 基本 操作 


考虑 下 述 集合 的 基本 操作 : 

1. MEMBER(o, S), ， 判 定 a 是 否 为 集合 5 中 的 元 素 。 若 是 ， 输 出 “是 ; 否则 ， 输 出 “ 否 ”。 

2. INSERT(a, $), FASU {a} 替换 集合 5。 

3. DELETE(a, S), HS- {al 替换 集合 S, 

4. UNION(S,, S,, $), FAS, =S,US, REA SA 5,。 为 避免 需要 在 5S,U 5, 中 删除 相同 的 
元 素 ， 当 执行 该 操作 时 ， 假 定 5, 和 5, 不 相交 。 

5. FIND(a) ， 输 出 包含 元 素 a 的 集合 的 名 称 。 如 果 a 不 止 在 一 个 集合 中 出 现 ， 则 该 指令 是 不 
确定 的 。 

6. SPLIT(a, S), BERS S 中 的 元 素 关 于 “<” 是 线性 有 序 的 。 该 操作 将 S 分 为 两 个 集合 S, 
和 5S,, 使 得 S,={bi b<a A bes}, Sj-ibl b>aAbeS}, 

7. MIN(S) ， 输 出 集合 $ 中 (关于 线性 序 ” <”) 的 最 小 元 素 。 

在 实际 操作 中 所 碰 到 的 许多 问题 都 可 以 被 简化 为 一 个 或 多 个 子 问题 ， 每 个 子 问题 抽象 表示 
成 在 某 个 数据 基 ( 元 素 的 全 集 ) 上 的 基本 指令 序列 。 本 章 将 考虑 指令 系列 o, o 中 的 指令 取 自 上 述 
7 种 集合 操作 的 某 个 子 集 。 

例如 ，MEMBER、INSERT 和 DELETE 操作 的 处 理 序列 是 许多 查找 问题 的 主要 部 分 。 能 够 用 来 处 
理 MEMBER、INSERT 和 DELETE 操作 序列 的 数据 结构 称 为 字典 ( dictionary ) 。 本 章 将 研究 几 类 用 来 实 
现 字 典 的 数据 结构 ， 诸 如 散 列 表 (hash table) 、 二 叉 查 找 树 (binary search tree) 和 2-3 树 (2-3tree) 等 。 

有 许多 有 趣 的 问题 ， 这 里 主要 关注 o 的 时 间 复 杂 度 ， 也 就 是 用 函数 度量 执行 o 中 的 指令 所 
需要 的 时 间 ， 该 函数 与 o 的 长 度 和 数据 基 的 大 小 有 关 。 我 们 将 考虑 平均 和 最 坏 情况 下 的 时 间 复 
杂 度 ， 并 进一步 区 分 在 线 (on-line) MAR (off-line) 复杂 度 的 差异 。 

定义 o 的 在 线 执行 要 求 ex 中 的 指令 从 左 向 右 执行 ， 在 og 中 执行 第 i 个 指令 时 无 项 考 虑 任何 
后 续 指 令 。er 的 离线 执行 允许 在 需要 得 到 答案 之 前 扫描 ex 中 的 所 有 指令 。 

显然 ， 任 何在 线 算 法 可 以 用 作 离 线 算法 ， 但 反 过 来 则 不 一 定 。 我 们 将 注意 到 ， 离 线 算 法 比 
任何 已 知 的 在 线 算 法 快 。 然 而 在 许多 应 用 中 ， 仅 限于 考虑 在 线 算 法 。 

给 定 要 执行 的 一 串 指令 ， 最 根本 的 问题 是 使 用 什么 数据 结构 来 表示 基本 的 数据 基 。 通 常 ， 
需要 细心 地 平衡 两 个 相互 冲突 的 要 求 。 典 型 情况 下 ， 指 令 序列 是 若干 以 未 知 顺 序 重复 执行 的 操 
作 。 有 可 能 存在 几 个 数据 结构 ， 每 个 都 能 使 某 个 操作 执行 起 来 很 容易 ， 但 其 他 操作 执行 困难 。 在 
多 数 情况 下 ， 最 好 的 解决 方案 是 取 某 种 折 襄 。 通 常会 采用 一 些 数据 结构 ， 虽 然 它们 不 能 让 任何 一 
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种 操作 最 容易 ， 但 是 却 使 整体 的 执行 优 于 任何 先前 的 方法 。 

现在 举例 说 明 如 何 根据 集合 操作 的 指令 系列 来 表示 图 的 生成 树 问 题 。 

定义 给 定 无 向 图 C=(V, E), G 的 生成 树 (spanning tree) 是 无 向 树 S=(Y，7)。C= (V, 
E) Wi SÉ ECCL REEL (OU, TO, (V, T), 05, OL, Ti)}， 所 及 组 成 了 V 的 一 个 
划分 59， 并 且 每 个 也 都 是 已 的 (可 能 为 空 的 ) 子 集 。 

图 C=(Y， 互 ) 的 代价 函数 < 是 从 五 到 实数 的 映射 ， 图 6 的 子 图 6' = (V',，E') 的 代价 c(C') 
为 了 ,eec(e)。 

例 4.1 考虑 图 4-1 中 的 算法 ， 寻 找 给 定 图 C -(V, E) 的 一 棵 最 小 代价 生成 树 S= (YY，7) 。 
5.1 节 将 详细 讨论 这 一 最 小 代价 生成 树 算法 ， 例 5. 1 举例 说 明 其 应 用 。 


begin 
T — f. 
Vs — g; 
for each vertex v € V do add the singleton set (v) to VS; 
while [5| > 1 do 
begin 


choose (v, w), an edge in E of lowest cost; 
delete (v, w) from E; 
if v and w are in different sets W, and W, in V5 then 
begin 
replace W, and W, in VS by W, U Wi; 
add (v, w) to T 





图 4-1 最 小 代价 生成 树 算法 


图 4-1 的 算法 使 用 了 E、T 和 VS3 个 集合 。 集 合 巨 包含 给 定 图 C 的 边 ， 集 合 了 用 来 存放 最 终 
生成 树 的 边 。 算 法 将 C 的 生成 森林 转化 为 一 棵 生成 树 。 集 合 VS 包含 生成 森林 中 树 的 顶点 集合 
初始 时 ，VS 包含 由 C 中 的 每 个 顶点 自身 所 组 成 的 集合 。 

将 算法 看 作 是 处 理 3 个 集合 E、T 和 VS 的 操作 序列 。 第 1 行 初始 化 集合 T。 第 2、3 行 初始 
化 VS, VS 中 的 元 素 本 身 就 是 集合 。 第 3 行将 初始 的 单元 素 集 添加 到 W。 第 4 行 控制 算法 的 主 循 
环 ， 对 集合 VS 中 顶点 集合 的 数目 进行 计数 。 第 7 THEN (0, w) 是 否 连 接生 成 森林 中 的 两 棵 
树 。 若 是 ， 则 在 第 8 行 合并 这 两 棵 树 ， 并且 在 第 9 行将 边 (v，w) 添 加 到 最 终 的 生成 树 中。 

第 7 行 要 求 能 够 在 VS 中 找到 含有 特定 顶点 的 集合 的 名 字 。( 在 VS 中 ， 集 合 所 使 用 的 实际 名 
称 并 不 重要 ， 因 此 可 使 用 任意 的 集合 名 。) 基 本 上 ， 在 第 7 行 要 求 能 够 有 效 处 理 FIND 原 语 。 类 似 
地 ， 第 8 行 要 求 能 够 对 不 相交 的 顶点 集合 执行 UNION 操作 。 

要 为 单独 处 理 UNION 操作 或 FIND 操作 寻找 数据 结构 是 相当 容易 的 。 然 而 ， 这 里 需要 的 数 
据 结构 应 该 使 UNION 和 FIND 操作 都 易于 实现 。 进 一 步 ， 由 于 第 8 行 UNION 操作 的 执行 依赖 于 
第 7 行 FIND 操作 的 输出 ， 所 需 的 UNION 和 FIND 指令 序列 必须 是 在 线 执行 的 。 在 4.6 和 4.7 节 
将 研究 两 个 这 种 类 型 的 结构 。 

考虑 对 边 集 巨 执行 的 操作 序列 ， 在 第 5 行 需 要 MIN 询问 原 语 ， 第 6 行 则 需要 DELETE 原 语 。 
我 们 已 经 为 这 两 个 原 语 找到 了 一 个 好 的 数据 结构 ， 就 是 3. 4 节 介绍 的 堆 (虽然 那里 用 堆 来 找 出 最 
大 元 素 , 但 是 显然 也 很 容易 用 堆 来 找 出 最 小 元 素 ) 。 

最 后 ， 仅 在 第 9 行 生成 树 的 边 集 7 要 求 INSERT 操作 ， 增 加 一 条 新 的 边 到 7。 用 一 个 单 链表 
即 可 满足 。 m 





O BIV UV U-UV, =V, 并 且 对 于 izxj, VOV =ð. 





~~ 
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在 选择 合适 数据 结构 来 处 理 指令 序列 o 时 ， 除 了 考虑 在 给 定 指令 序列 o 中 会 出 现 哪些 指令 
外 ， 还 需 考虑 的 另 一 个 重要 问题 是 由 o 所 操作 的 数据 基 ( 全 集 ) 的 大 小 。 例 如 在 第 3 章 中 ， 如 果 
元 素 是 某 个 适当 范围 内 的 整数 ， 用 桶 排序 可 以 在 线性 时 间 内 完成 n 个 元 素 序列 的 排序 问题 。 然 
而 ， 如 果 元 素 取 自 任意 的 线性 有 序 集 ， 那 么 可 得 到 的 最 优 时 间 为 0(nlogn) 。 

本 节 将 考虑 处 于 变化 状态 的 元 素 集 合 5 的 维护 问题 。 新 元 素 添加 到 $ 中 ， 从 5 中 移 除 
旧 元 素 ， 并 且 不 时 地 回答 问题 :“ 元 素 x 当前 在 S 中 吗 ?” 。 很 自然 地 ， 这 个 问题 可 由 一 个 字 
典 来 模拟 ; 我 们 需要 一 个 数据 结构 ， 它 允许 便利 地 处 理 MEMBER, INSERT 和 DELETE 指令 
系列 。 假 定 从 一 个 非常 大 的 全 集中 选择 可 能 出 现在 S 中 的 元 素 , 将 $ 表示 为 一 个 位 向 量 就 
变 得 不 切实 际 了 。 

例 4.2 编译 程序 或 汇编 程序 会 跟踪 其 正在 翻译 的 程序 中 出 现 的 所 有 标识 符 组 成 的 “符号 
表 ”。 对 于 大 多 数 程序 语言 来 说 ， 所 有 可 能 标识 符 组 成 的 集合 是 非常 大 的 。 例 如 ， 在 FORTRAN 
语言 中 ， 存 在 大 约 1. 62 x 10 个 可 能 的 标识 符 。 因 此 ， 用 一 个 数组 来 表示 符号 表 ， 并 对 每 个 可 能 
标识 符 分 配 一 项 ， 而 不 考虑 标识 符 是 否 确实 出 现在 程序 中 ， 这 是 不 可 思议 的 。 

对 符号 表 ， 编 译 程序 执行 的 操作 分 为 两 类 。 首 先 ， 当 磁 到 新 标识 符 时 ， 必 须 将 它们 加 入 到 
表 中 。 这 包括 在 表 中 创建 一 个 位 置 ， 存 储 特 定 标识 符 及 其 有 关 的 数据 (诸如 实 型 还 是 整 型 ?) 。 其 
次 ， 编 译 程序 随时 可 能 请 求 关于 某 个 标识 符 的 信息 (例如 ， 标 识 符 是 整 型 吗 ?) 。 

因此 ， 能 够 处 理 INSERT 和 MEMBER 操作 的 数据 结构 可 能 必须 足以 实现 一 个 符号 表 。 实 际 
上 ， 本 节 讨 论 的 数据 结构 经 常用 来 实现 一 个 符号 表 。 口 

考虑 散 列 技术 (hashing) ， 不 仅 处 理 在 符号 表 构 造 中 所 需要 的 INSERT 和 MEMBER 指令 ， 而 
且 也 处 理 DELETE 指令 。 关 于 散 列 方案 ,存在 多 种 变形 ， 这 里 仅仅 考虑 其 基本 思想 。 


… List for hla) = 0 


eee List for h(a) = 1 





*** List for Ala) =m — 1 


图 4-2 一 种 散 列 方案 


图 4-2 给 出 了 一 种 散 列 方案 ， 其 中 的 散 列 函数 将 全 集 ( 例 如 ， 符 号 表 中 所 有 可 能 标识 符 的 
集合 ) 中 的 元 素 映 射 到 整数 0 到 m - 1。 假定 对 所 有 的 元 素 a， 能 够 在 常数 时 间 内 计算 h(a)。 存 在 
大 小 为 m 的 数组 4， 其 项 为 指向 S$ 中 元 素 列表 的 指针 。 由 4[ 门 指向 的 列表 包含 所 有 使 得 h(a) =i 
的 、 在 5 中 的 元 素 a。 

为 执行 指令 INSERT(a，5) ,计算 h(a) 并 搜索 由 4A[h(a)] 指 向 的 列表 。 若 a 不 在 该 列表 中 ， 
则 添加 到 表 尾 。 为 执行 指令 DELETE(a，S)， 再 次 搜索 列表 4[h(a) ] ， 如 果 a 在 列表 中 ， 则 删除 
Zo HEUS, MEMBER(a, S) 指令 通过 扫描 列表 A[h (a) ] 来 得 到 结果 。 

这 种 散 列 方案 的 计算 复杂 性 是 易于 分 析 的 。 从 最 坏 情况 的 角度 ， 结 果 并 不 很 好 。 例 如 ， 假 
定 由 个 不 同 的 INSERT 操作 组 成 的 序列 o, 应 用 到 每 个 要 插入 的 元 素 后 可 能 产生 相同 的 数 ， 
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结果 所 有 元 素 都 出 现在 同一 列表 中 。 在 这 种 情况 下 ， 处 理 o 中 第 i 个 指令 需要 与 i 成 比例 的 时 
间 。 因 此 ， 将 所 有 个 元 素 加 入 到 集合 S 中 ， 用 散 列 法 所 需要 的 时 间 与 REB. 

然而 ， 从 期 望 时 间 的 角度 看 ， 散 列 法 看 起 来 更 好 。 若 假定 上 ia) 等 可 能 地 为 0~ 亚 -1 中 的 任 
意 值 ， 并 且 要 揪 人 nm ToU, MA4MABi 个 元 素 时 ， 被 取代 列表 的 期 望 长 度 为 人- 1)Am 
(总 是 小 于 1)。 因 此 ,插入 个 元 素 所 需要 的 期 望 时 间 是 0(n)。 如 果 执 行 0(n) 个 DELETE 和 
MEMBER 操作 连同 INSERT 操作 ， 总 的 期 望 代价 仍然 为 0(n)。 

记 住 ， 该 分 析 假 定 散 列表 的 规模 m 大 于 或 等 于 集合 5 的 最 大 规模 n。 但 是 ，n 通常 是 预先 未 
知 的 。 当 nn 未 知 时 ， 执 行 处 理 的 合理 方式 是 准备 好 构建 一 个 散 列 表 序列 7T,，T,，7T, ，…。 

选择 合适 的 值 作为 初始 散 列表 7 的 规模 m。 一 旦 插入 到 7, 的 元 案 数 目 超过 m， 则 创建 一 个 
规模 为 2m 的 新 散 列表 7T, ， 并 通过 再 次 散 列 ” ， 将 当前 处 于 7, 中 的 所 有 元 素 移 入 T,。 此 时 ,放弃 
旧 的 散 列表 7,。 接 着 在 7 继续 插入 更 多 的 元 素 ， 直 到 元 素数 自 超过 2m。 这 时 ， 创 建 规模 为 4m 
的 新 散 列表 7,， 并 将 7 中 的 元 素 重 散 列 到 T, WMA, 一 旦 表 T, BA ‘mt, Rel 
建 规模 为 2m 个 元 素 的 散 列表 7,。 依 此 类 推 ， 直 到 已 经 插入 所 有 元 素 。 

使 用 这 种 方案 并 假定 m=1， 考 虚 插 入 2“ 个 元 素 到 散 列表 中 需要 的 期 望 时 间 。 可 通过 递归 来 
模拟 这 一 过 程 : 

7(1) =1 
T(2*) 2T(2*^À) «2* 

BR, Hf TO) =2 -1。 

由 此 可 见 ， 由 n 个 INSERT, MEMBER 和 DELETE 指令 组 成 的 指令 序列 ， 用 散 列 法 来 处 理 ， 
可 以 在 0(n) 期 望 时 间 内 完成 。 

散 列 函 数 有 的 选择 相当 重要 。 如 果 要 添加 到 S 中 的 元 素 是 均匀 分 布 在 0 到 7 范围 内 的 整数 ， 
其 中 r> >n， 那 么 h(a) 可 取 模 m 余 a， 其 中 mm 为 当前 散 列表 的 规模 。 散 列 函 数 的 其 他 例子 可 在 
本 章 结尾 所 引用 的 一 些 参 考 文献 中 找到 。 


4.3 二 分 搜索 


本 节 将 讨论 一 个 简单 的 搜索 问题 ， 并 比较 3 种 不 同 解决 方案 的 优 劣 。 给 定 集合 5， 包 含 取 自 
某 个 较 大 的 全 集 的 个 元 素 ， 现 在 来 处 理 仅 包含 MEMBER 指令 的 操作 序列 o. 

最 直观 的 解决 方案 是 将 $ 中 的 元 素 存储 在 一 个 列表 中 ， 通 过 顺序 搜索 该 列表 来 处 理 每 个 
MEMBER(a，5S) 指 令 ， 直 到 找到 给 定 元 素 a, 或 者 列表 中 的 所 有 元 素 都 已 经 查验 为 止 。 在 最 坏 情 
况 和 期 望 情况 下 ， 用 这 种 解决 方案 处 理 o 中 的 所 有 指令 ， 所 需要 的 时 间 与 nx Lo! 成 比例 。 该 
方案 的 主要 优点 在 于 ， 所 需要 的 处 理 时 间 很 少 。 

另 一 种 解决 方案 是 将 S 中 的 元 素 插 人 到 规模 为 1 S ! 的 散 列 表 中 ， 通 过 搜索 列表 h(a) 来 执行 
指令 MEMBER(e，$) 。 如 果 能 找到 一 个 好 的 散 列 函数 h, MERFI o 时 ， 该 解决 方案 要 求 
04 cb 的 期 望 时 间 和 Onl o 1) 的 最 坏 情况 时 间 。 主 要 的 难点 在 于 找到 一 个 散 列 函数 ， 使 S 中 的 
元 素 均 匀 分 布 在 整个 散 列表 中 。 

如 果 S 存在 一 个 线性 序 < ， 则 第 3 种 解决 方案 是 采用 二 分 搜索 。 将 $ 中 的 元 素 存 储 在 数组 4 
中 ， 对 该 数组 进行 排序 ， 使 得 4[1] <4[2] <… <4[n]。 然 后 判定 是 否 元 素 a 在 5 中 。 比 较 a 和 
存储 在 位 置 L (1 +n)/2] 上 的 元 素 5。 如 果 a =b， 比 较 终止 并 回答 “是 ”; 否则， 如 果 a <5， 对 数 
组 的 前 半 部 分 重复 这 一 过 程 ; 如 果 a > 5， 则 对 数组 的 后 半 部 重复 这 个 过 程 。 通 过 不 断 地 折 半 分 
离 搜索 域 ， 找 到 a 或 者 判定 其 不 在 S 中 永远 不 会 需要 超过 [ log(n + 1) 1 次 比较 。 





所 ”必须 使 用 一 个 新 的 散 列 函数 ， 其 散 列 值 从 0 到 2m -1。 
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图 4-3 中 给 出 的 递归 程序 SEARCH(a, f, 1) 在 数组 A KEES, F1, f+2, =, D 上 查找 元 
Xa. HT WE a ROTE Sh, 调用 SEARCH(a, 1, n). 

要 理解 该 程序 如 何 工作 ， 可 以 设想 将 数组 A 
表示 为 一 棵 二 又 树 。 树 的 根 位 于 位 置 | (1 + m)/ 
2」， 根 的 左右 儿子 位 于 位 置 L (1 +n) /4 | L3 (1 
+n)/4」， 依 此 类 推 。 下 一 节 将 给 出 二 分 搜索 的 
更 为 清晰 的 解释 。 

显然 ， 当 查找 4 中 任意 元 素 时 ，SEARCH 至 
多 包含 [log(n+1) ] 次 比较 ， 由 于 在 树 中 不 存在 mE 
长 于 Flog(n +1) 1 的 路 径 。 如 果 所 有 元 素 成 为 某 图 43 一 分 搜索 算法 
次 搜索 的 目标 的 可 能 性 是 相等 的 ， 那 么 也 可 以 证 明 ( 习 题 4 4) ， 在 处 理 序列 o 中 的 MEMBER 指 
令 时 ， 过 程 SEARCH 给 出 了 最 优 的 期 望 比较 次 数 (也 就 是 ，| | xlogn) .9 


4.4 二 义 查 找 树 


考虑 如 下 问题 。 要 向 集合 S 中 揪 人 元 素 ， 并 从 $ 中 删除 元 素 。 另 外 ， 有 时 要 知道 一 个 给 定 的 
元 素 是 否 在 3 中 ， 或 者 当前 在 S 中 的 最 小 元 素 是 什么 。 假 定 要 增加 到 S 中 的 元 素来 自 一 个 大 的 全 
K, BERNAR“ 大" 是 线性 有 序 的 。 该 问题 能 够 抽象 为 处 理 INSERT, DELETE, MEMBER 和 
MIN 的 指令 序列 。 

我 们 已 经 知道 ， 对 于 处 理由 INSERT, DELETE 和 MEMBER 组 成 的 指令 序列 ， 散 列表 是 一 个 
很 好 的 数据 结构 。 然 而 ， 不 搜索 整个 表 ， 就 不 可 能 在 散 列 表 中 找到 最 小 元 素 。 适 合 所 有 四 种 指令 
的 数据 结构 是 二 又 查找 树 。 

定义 ”集合 5 的 二 又 查找 树 (binary search tree) 是 一 棵 标记 二 叉 树 ， 用 元 素 Ur) e S 来 标记 
BAT Av, EA 

l. tobe BEP ABA A v, (u) «l(), 

2. SN v 的 右 子 树 中 的 每 个 顶点 w，!(u) >i(v)， #84 

3. 对 于 每 个 元 素 ae S， 恰 好 存在 一 个 顶点 ov 使 得 1(v) =a。 

注意 ,条件 1 和 2 意味 着 树 的 标记 是 有 序 的 。 条 件 3 由 1 和 2 得 出 。 

例 4.3 对 于 ALGOL 关键 字 begin, else, end, if 9i then, 图 44 给 出 了 一 棵 可 能 的 二 又 查 
找 树 。 这 里 的 线性 序 是 字典 序 。 口 
要 确定 元 素 a 是 否 包 含 在 由 一 棵 二 叉 查 找 树 表示 的 集合 Sh, Ca) 

可 将 与 根 的 标记 进行 比较 。 如 果 根 的 标记 是 a， 那么 显然 a 在 5 
H, WR a 小 于 根 的 标记 ， 则 搜索 根 的 左 子 树 ( 如 果 存 在 的 话 ) n 
Ra 大 于 根 的 标记 ， 则 搜索 根 的 右 子 树 。 要 是 a 在 树 中 ， 那 么 它 将 Um) Cone) 
最 终 被 找 出 。 否 则 ， 当 搜索 到 空 的 左 或 右 子 树 的 时 候 ， 过 程 终 止 。 
算法 4.1 搜索 一 棵 二 叉 查 找 树 。 
WA: 集合 5 的 一 棵 二 叉 查 找 树 T 和 元 素 a, 
fh: 如 果 ae5， 则 为 “是 ”; 否则 为 “ 否 ”。 Co) 
方法 : 如 果 了 为 空 BEA’, BM, Sr HTB. RE, 
算法 进行 唯一 的 程序 调用 SEARCH(a，r) ，SEARCH 是 图 4-5 定义 的 ”图 44 一 棵 二 叉 查 找 树 






procedure SEARCH(a, f, D: 
Wf f > | then retara “no” 
else 


If a = ALLO + D/2j] then return "yes" 
else 





if a < ALLG D/2]) then 
retarn SEARCH(, f, LU+ 0/2] — 1) 
else return SEARCH(a, [(f + D/2] +1, D 





O “当然 ， 散 列 法 的 实现 不 仅 通过 比较 ， 而 且 可 能 散 列 法 “ 优 于 "二 分 搜索 ,并 且 在 许多 情况 下 ， 确 实 如 此 。 


O ”虽然 树 的 定义 要 求 一 棵 树 至 少 包含 一 个 作为 根 的 顶点 ， 但 是 在 许多 算法 中 ， 将 空 树 (不 包含 任何 顶点 的 树 ) 也 作 
为 二 叉 树 来 处 理 。 
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递归 程序 。 口 


procedure SEARCH(a, v): 
if a = K(v) then return "yes" 
else 


if a < K(v) then 
if v has a left son w then return SEARCH(a, w) 
else return "no" 

else 
if v has a right son w then return SEARCH(a, w) 
else return "no" 





图 4-5 搜索 一 棵 二 叉 查找 树 


显然 ， 执 行 指令 MEMBER(a，S) ， 算 法 4.1 已 经 足够 了 了， 而且， 可 以 很 容易 地 对 它 进行 修 
改 以 执行 指令 INSERT(a，5)。 如 果树 为 空 ， 则 创建 标记 为 a 的 根 。 如 果树 非 空 ， 并 且 要 揪 人 的 
元 素 不 存在 树 中 ,那么 在 第 3 或 5 行 ，SEARCH 程序 不 能 找到 一 个 儿子 。 此 时 为 元 素 创 建 一 个 新 
的 顶点 ， 并 关联 到 到 缺少 儿子 的 位 置 ， 而 不 是 在 第 4 或 6 行 分 别 返 回 “ 否 ”。 

执行 MIN 和 DELETE 指令 时 ， 二 叉 查 找 树 也 很 方便 。 沿 着 路 径 v。，2z,…，v,， 可 找到 二 叉 查 
找 树 7 的 最 小 元 索 ， 其 中 久 是 了 的 根 ， 对 于 1<i<p, oÆ n ,BJAJLT, E v, RAAILT, ov 的 
标记 是 了 中 的 最 小 元 素 。 在 某 些 问题 中 ， 保 存 一 个 指向 ww 的 指针 能 提供 便利 ， 以 使 得 访问 最 小 元 
素 时 仅 需 要 常数 访问 时 间 。 

指令 DELETE(a，5) 的 实现 稍 显 困难 。 假 定 在 顶点 wv 找到 了 要 删除 的 元 素 a， 可 能 出 现 三 种 
情形 。 

l.» 是 叶子 顶点 ， 在 这 种 情况 下 ， 从 树 中 删除 顶点 v; 

2. 顶点 恰好 有 一 个 儿子 ， 在 这 种 情形 ， 使 。 的 父亲 成 为 的 儿子 的 父亲 ， 从 树 中 删除 如 
Jv 是 根 顶 点 ,那么 使 "的 儿子 成 为 新 的 根 ) ; 

3. 顶点 有 两 个 儿子 ， 找 到 "的 左 子 树 中 的 最 大 元 素 b。 递 妇 地 ， 从 子 树 中 删除 包含 5 的 项 
点 ， 并 将 "的 标记 设 为 bn。 注 意 , 将 成 为 整 棵 树 中 小 于 a 的 最 大 元 素 。 

DELETE 操作 的 基于 简化 ALGOL 语言 的 实现 留 作 练习 。 注 意 ， 单 一 的 MEMBER, INSERT, 
DELETE 或 者 MIN 指令 可 能 需 用 0(n) 时 间 。 

例 4.4 假定 要 从 图 44 的 二 叉 查 找 树 中 删除 单词 让。 单词 让 位 于 根 位置 ， 有 两 个 儿子 。 在 
根 的 左 子 树 中 小 于 证 (字典 序 ) 的 最 大 单词 是 end。 从 树 中 删除 标记 为 end 的 顶点 ， 并 且 在 根 位 置 
FH end 取代 if, Ale, h F end 有 一 个 儿子 (begin) f£ begin 成 为 根 的 儿子 ， 得 到 图 4-6 中 
的 树 。 口 


当 用 一 棵 二 又 查找 树 来 表示 基础 集合 时 ， 考 虑 由 个 INSERT 组 (ed) 
成 的 指令 序列 的 时 间 复 杂 度 。 将 元 素 a 插入 到 一 棵 一 叉 查 找 树 中 需要 
的 时 间 是 有 界 的 ， 它 是 a 与 树 中 已 有 元 素 的 比较 次 数 的 常数 倍 。 因 
此 ， 可 以 根据 所 作 的 比较 次 数 来 测量 时 间 。 Coen) (Cam 
在 最 坏 情形 ， 增 加 个 元 素 到 一 棵 树 中 可 能 需要 二 次 方 时 间 。 例 
如 ， 假 定 要 增加 的 元 素 序 列 正巧 是 有 序 的 ( 增 序 ) 。 在 这 种 情况 下 ， 查 
找 树 将 包含 由 右 儿 子 组 成 的 单 链 。 然 而 ， 如 果 插 入 n DENTE, M (ee) 
像 下 述 定理 所 表明 的 ， 需 要 的 插入 时 间 为 O(n log n). 
定理 4.1 GUPnazI, 插入 n 个 随机 元 素 到 初始 为 空 的 二 又 查 找 图 46 执行 DELETE 后 的 
树 ， 需 要 的 期 望 比较 次 数 是 O(n log n). 二 又 查找 树 
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证 明 : 由 序列 a, ，a,，…，a, 创 建 一 棵 二 叉 查 找 树 时 ， 令 TC n) 为 序列 元 素 之 间 需 要 的 比较 
次 数 。 假 定 T(0) =0， 并 令 b ，5,，…，5b, 为 已 按 升序 排 好 的 序列 。 

如 果 a, ，… ，a, 为 元 素 的 随机 序列 ， 那 么 对 于 任意 j(1 <j<n) ，a, 等 可 能 地 为 6。 元 素 a 成 
为 二 又 查找 树 的 根 ， 且 在 最 终 的 树 中 , j -1 个 元 素 b,，5,，…，6,_, 将 位 于 根 的 左 子 树 ，n -j 个 
元 素 ba, b, …， 凡 将 包含 在 右 子 树 中 。 

现在 来 计算 将 b, ，6b, ，…，b,_! 插 入 到 树 中 的 期 望 比较 次 数 。 这 些 元 率 中 的 每 个 都 同根 比较 
一 次 ， 总 共同 根 比较 j -1 次。 然后， 递归 地 ,插入 b,，b,，…，65., 到 树 的 左 子 树 中 ， 还 需要 
T( -1) 次 比较 。 所 有 加 起 来 ， 插入 b,，6,，…， 5b 到 二 叉 查 找 树 中 ,需要 进行 j -1+7(j -1) 
次 比较 。 类 似 地 ,插入 6,,, ，b,,，,，…，6b, 到 树 中 ， 需 要 进行 4 —j + T(n -j) RB 

由 于 j 等 可 能 地 取 1 到 中 的 任意 值 ， 有 


T(n) = LY (n-1 + 7-1) TG) (4-1) 
对 式 (4-1) 进 行 简单 的 代数 运算 ， 得 到 
T(n) 2n-1 Y T(j) (4-2) 


使 用 3. 5 节 中 的 技术 ， 能 够 证 明 
T(n) <knlogn 

A'hk-ln4-1.39, BH JE, $8 A n 个 元 素 到 一 棵 二 又 查找 树 中 的 期 望 比 较 次 数 是 
O(n log n), 口 

总 之 ， 使 用 本 节 的 技术 ， 可 以 在 O(n log n) 的 期 望 时 间 内 ， 处 理由 个 INSERT, DELETE, 
MEMBER 和 MIN 指令 组 成 的 随机 指令 序列 。 最 坏 情况 下 的 执行 性 能 是 二 次 方 的 。 然 而 ， 通 过 使 
Fil 4. 9 节 和 习题 4. 30 ~4.37 中 讨论 的 平衡 树 方案 (2-3 树 、AVL 树 或 者 有 界 平衡 树 ) 之 一 ， 即 可 
使 最 坏 情况 下 的 性 能 提高 到 O(n log n). 


45 最 优 二 又 查找 树 


在 4.3 节 给 定 集合 $= |a,，a,…，oa,1( 某 大 全 集 的 一 个 子 集 ) ， 要 求 设计 一 个 数据 结构 ， 
可 以 有 效 地 处 理 一 个 仅 包 含 MEMBER 指令 的 序列 og。 再 次 考虑 该 问题 ， 不 过 这 次 假定 ， 除 了 给 
定 的 集合 $ 外， 对 于 全 集 U 中 所 有 的 元 素 a, 给 出 指令 MEMBER(a, S) E o 中 出 现 的 概率 。 现 
在 为 5 设计 一 棵 二 又 查找 树 ， 以 期 望 的 最 小 比较 次 数 在 线 处 理 MEMBER 指令 序列 a. 

假定 a;,，a,.…，a, 为 集合 S 中 的 元 素 ， 以 升序 排列 。P 为 指令 


MEMBER(a,, S) ft o 中 出 现 的 概率 。 对 于 某 些 e < a,， go 为 形 如 六 
MEMBER(a，$) 的 指令 在 a 中 出 现 的 概率 。 对 于 某 些 a, <aK<a,,,, Ceo) Com 
9; 为 形 如 MEMBER(a，S) 的 指令 在 o 中 出 现 的 概率 ; 对 于 某 些 e > 


a, 9,552 40 MEMBER(a, S) dS YE o 中 出 现 的 概率 。 为 了 定义 
二 又 查找 树 的 代价 (cost) ， 可 加 入 m+1 个 假想 的 叶子 (fiotitios CH OO © 
leaves) ， 以 便于 构造 集合 U -5 中 的 元 素 的 映射 ， 称 这 些 叶子 为 0， 


pos. d Cm 
图 4-7 为 图 4-4 的 二 叉 查 找 树 加 入 了 这 类 假想 叶子 。 例 如 ， 标 记 

为 3 的 叶子 表示 元 素 a， 满足 end < a c if, O © 
接 下 来 需要 定义 二 又 查找 树 的 代价 。 如 果 元 素 a 为 某 个 顶点 4 的 


图 4-7 添加 叶子 后 的 
标记 1v) ， 则 在 处 理 指令 MEMBER(a，5) 时 访问 的 顶点 数 比 顶点 2 的 二 叉 查找 树 


REKI. Fags, Ha <a <a,,,， 为 处 理 指令 MEMBER(a, S), ij 
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间 的 顶点 数 等 于 假想 叶子 i 的 深度 。 因 而 ， 二 叉 查 找 树 的 代价 可 如 下 定义 
X» x (DEPTH(a,) +1) + > x DEPTH(i) 


一 日 有 了 最 小 代价 二 叉 查找 树 7， 就 能 够 以 顶点 访问 的 最 小 期 望 次 数 来 执行 MEMBER 指令 
序列 ， 只 需 简单 地 将 算法 4 1 应 用 于 7， 处 理 每 条 MEMBER 指令 。 

给 定 各 个 p. 和 g,， 如 何 找到 一 棵 最 小 代价 树 呢 ? 分 治 ( divide-and-conquer) 法 要 求 先 确定 根 元 
X a,。 这 就 把 问题 分 为 两 个 子 问题 : 构造 左 子 树 和 构造 右 子 树 。 然 而 ， 要 确定 根 似乎 并 不 容易 ， 
因此 ， 解 决 整个 问题 还 是 有 困难 的 。 由 于 要 考虑 2n 个 子 问题 ， 而 对 应 每 个 可 能 的 根 包含 两 个 子 
问题 ， 由 此 ， 很 自然 引出 了 动态 规划 方案 。 

X-FOsicjen, TAER lan, mus cs aj 的 子 集 的 一 棵 最 小 代价 树 。c, 为 7 的 代价 ， 
r2 THAR. THAR (weight) w, EXW qi + (pii qd) + 7 + (pj FG) 0 

如 图 48 所 示 ， 树 7, 包 含 根 a, EFR Taa Lu 
ana …，o 的 一 棵 最 小 代价 树 ， 右 子 树 TD lays, aus (n) 
Ja] RMR, io k- 1， 则 不 存在 左 子 树 ; E 
-j, 无 右 子 树 。 为 便于 符号 表示 ,将 7, 看 作为 空 择 ，7, 的 权 什 


wF qis 其 代价 ci 为 0。 
由 树 T.,_, 和 7 中 的 深度 ， 树 7 的 左右 子 树 上 每 个 顶点 的 深 


度 增 1， 其 中 i<j。 因 此 ,TT 的 代价 cj 可 表示 为 
Cy = wy.) tpa + Wy tC ri + Cw 图 4-8 FHT, 
mU£ +C rai ey 

Arp k ARUBA caa + cb 为 最 小 。 因 此 ， 为 找到 一 棵 最 优 树 T,, SEE RET Kk), 
计算 树 的 代价 ， 其 中 该 树 以 a 为 根 ， 左 子 树 为 7,.,， 右 子 树 为 T; ， 然 后 选择 一 棵 具有 最 小 代价 
的 树 。 具 体 细节 包含 于 下 述 算法 中 。 

算法 4.2 构造 一 棵 最 优 的 二 叉 查 找 树 。 

输入 : 元 素 集 $S= | al，a,,，…，a,|。 假 定 a, «a, <… <a, WEWE qu. m. on. 
q, pi, Poy cos. p, HRM Fi i<n，g,; 表 示 执 行 一 条 MEMBER(c，S) 指令 的 概率 ， 
该 指令 接收 所 有 满足 ai < a <a,. 的 a。gqo 表 示 a >a, 时 ,执行 MEMBER(a，,，5) 指 令 的 概 
率 。 对 于 1<i<n,，p, 表 示 执 行 MEMBER(o,，3) 指令 的 概率 。 

输出 : S 的 一 棵 最 小 代价 二 又 查 找 树 。 

Bik: 

1. MFOsi<j<n, MRE 4-9 的 动态 规划 算法 ， 按 7 -i 值 的 增 序 ， 计算 上 和 cy。 

2. 在 计算 了 各 个 方 后 ， 调 用 BUILDTREE(0，m) 为 76 递归 地 构造 一 棵 最 优 树 。 图 4-10 是 程 
FF BUILDTREE, Li 

814.5 XJ&4 JUR a, «a, «a, «a,, q,71/8, q, 23/16, 4,74, =q 21/16, Hp, - 1/4, 
p, 21/8, p, =p, =1/16, 图 4-11 给 出 由 图 4-9 所 给 出 的 算法 计算 出 的 ww、 六 和 ev 的 值 。 为 便于 表 
RW, ERP wc 的 值 都 乘 了 16。 
比如 ， 要 计算 re， 必须 比较 cu toy. Cy tey Me, +cu 的 值 ，( 乘 以 16 后 ) 分 别 为 8、9 和 
11。 因 此 ， 在 图 4-9 的 第 8 行 , k=2 时 最 小 ,所 以 ms =a 
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for i — 0 until n do 


Wa *7 qi; 
Cy 0 
end; 
for | —— 1 until 2 do 
for i «- 0 until n — | do 


je ilh 

Wy © Wi- t pit dy 

let m be a value of k, i < k = j, for which cu + Crs 
is minimum; 

Cy — Wy t Coma t Cw; 

ry am 





图 4-9 计算 最 优 子 树 的 根 的 算法 


procedure BUILDTREEXi, j): 
begin 
create vertex vy, the root of Ty; 
label vy by ry; 
let m be the subscript of ry (Le., ry = au); 
ifi< m — 1 thea make BUILDTREE(i, m — 1) the left subtree of vy; 


if m < j then make BUILDTREE(m, j) the right subtree of vy 
end 


图 4-10 构造 最 优 二 叉 查 找 树 的 程序 


l=j-i 
1 0 

1 

2 

3 

4 


图 4-11 2、m 和 cy 的 值 
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计算 了 图 4-11 的 表 之 后 ， 可 以 通过 调用 BUILDTREE(0，4) 构造 树 Tu 。 得 到 的 二 叉 查找 树 
如 图 4-12 所 示 ， 这 棵 树 的 代价 为 33/16。 口 

定理 4.2 用 算法 4.2 构造 一 棵 最 优 二 叉 查 找 树 ， 需 要 O(n’) 
的 时 间 。 

证 明 : 计算 了 7r, 表 ， 就 可 以 应 用 程序 BUILDTREE ， 在 0(n) 时 
间 内 从 该 表 构 造 一 棵 最 优 树 。 程 序 仅 有 n 次 调用 ， 且 每 次 调用 需要 
的 时 间 为 常数 。 

代价 最 高 的 部 分 是 图 4-9 中 的 动态 规划 算法 。 第 8 行 寻 找 合适 
AAA, fic... + cs 最 小 。 这 要 求 0(j -i 记 ) 时 间 。 在 第 5 ~ 10 行 之 
间 的 循环 中 的 其 他 步骤 需要 常数 时 间 。 第 4 行 执行 n 次 外 部 循环 ， 
对 于 外 循环 的 每 次 和 迭代， 至 多 执行 上 次 内 循环 。 因 此 ， 总 的 代价 是 ”图 4-12 一 棵 最 小 代价 树 
O(n’). 

PREMIERE Ss, UJ 1=j -i 的 一 个 简单 规约 表明 ， 在 第 9 和 10 ERHET rA cyo 

为 了 证 明 可 通过 BUILDTREE 构造 一 棵 最 优 树 是 正确 的 ， 通 过 观察 ， 如 果 顶 点 Ela, 





Gio, tt, a,| 的 一 棵 子 树 的 根 ， 那么 其 左 儿 子 将 是 {a,,,， Qi "t, a,_, 的 一 棵 最 优 树 的 根 ， 
其 中 7 =a,， 且 其 右 儿 子 将 是 a,,, ，a,，，…，aj| 的 一 棵 最 优 树 的 根 。 因 此 ， 显 而 易 见 ， 由 归 
纳 证 明 ，BUILDTREE(i， 旋 为 ta ，a;,;，…，aj| 正 确 地 构造 了 一 棵 最 优 树 。 口 


在 算法 4.2 中 ， 可 以 把 图 4-9 第 8 行 中 对 m 的 查找 限定 在 7.,. M T, ,的 根 位 置 之 间 的 范围 ， 
且 仍 可 保证 找到 一 个 最 小 值 。 通 过 这 一 修改 ， 算 法 4. 2 能 够 在 O( n^ ) 时 间 内 找到 一 棵 最 优 树 。 


4.6 简单 的 不 相交 集合 合并 算法 


考虑 在 例 4. 1 的 生成 树 算法 中 对 顶点 的 处 理 ， 由 此 引出 的 集合 处 理 问题 具有 下 列 三 个 特征 。 

1. 任何 时 候 合并 两 个 集合 ， 它 们 都 是 不 相交 的 ; 

2. 集合 中 的 元 素 可 以 看 作 是 1 ~n 之 间 的 整数 ; 

3. 操作 为 UNION 和 FIND。 

本 节 和 下 一 节 将 考虑 这 类 问题 的 数据 结构 。 假 设 给 定 ”个 元 素 ， 取 整数 1，2，…，n。 初始 
时 ， 假 定 每 个 元 素 各 自 处 于 本 身 的 集合 中 。 执 行 UNION 和 FIND 指令 序列 。 回 想 一 下 ，UNION 
指令 的 形式 为 UNION(4，B，C) ， 表 示 两 个 不 相交 集合 4 和 8B 将 被 它们 的 并 所 替换 ,该 并 集 称 
为 C。 在 应 用 中 ， 选 用 什么 来 命名 集合 通常 无 关 紧 要 ， 因 此 ， 假 定 集合 可 以 使 用 1 ~n 之 间 的 整 
数 命名 。 而 且 ， 假 定 不 会 给 两 个 集合 以 相同 的 名 字 。 

对 于 该 问题 的 处 理 ， 存 在 几 种 有 趣 的 数据 结构 。 本 节 将 给 出 一 个 能 够 在 0(n log n) 时 间 处 理 
指令 序列 的 数据 结构 ， 该 指令 序列 至 多 可 包含 n -1 条 UNION 指令 和 0(n log n) 条 FIND 指令 。 
下 一 节 将 描述 男 一 个 数据 结构 ， 它 将 在 一 个 近乎 线性 于 的 最 坏 情况 时 间 内 ， 处 理由 0(n) 条 
UNION 和 FIND 指令 组 成 的 序列 。 这 些 数据 结构 也 能 够 以 同样 的 计算 复杂 性 ， 处 理 INSERT、 
DELETE 和 MEMBER 指令 序列 。 

注意 ,在 4.2 ~4.5 节 中 考虑 的 搜索 算法 假定 元 素 取 自 一 个 全 集 ， 该 全 集 的 规模 远大 于 要 执 
行 指令 的 数目 。 本 节 假 设 全 集 的 规模 同 要 执行 的 指令 序列 的 长 度 近似 。 

或 许 对 于 UNION-FIND 问题 ， 最 简单 的 数据 结构 是 使 用 数组 表示 在 任 一 一 时 刻 出 现 的 集合 的 合 
$& ( collection of sets)。 设 民 为 大 小 为 n 的 数组 ，R[ 门 表示 包含 元 素 i 的 集合 名 。 由 于 集合 的 名 字 
并 不 重要 ， 初 始 可 以 取 Ri] =i，1<isn， 表 示 在 初始 时 集合 的 合集 可 表示 为 {11} ，|21， 
in} |， 并 且 集 合 | 计 命名 为 i。 
执行 指令 FIND(i) 可 通过 打印 R[ 引 的 当前 值 实现 。 因 此 ， 执 行 一 条 FIND 指令 的 代价 是 常 
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量 ， 这 正 是 我 们 所 期 望 的 最 好 情形 。 

为 执行 指令 UNION(A, 中 ，C) ， 顺 序 扫 描 数 组 R， 且 包含 4 或 中 的 每 项 都 设置 为 C。 因 此 ， 
执行 一 条 UNION 指令 的 代价 是 0(n)。n 个 UNION 指令 序列 可 能 需要 On ) 时 间 ， 这 种 结果 并 不 
令 人 满意 。 

这 一 简单 的 算法 可 以 通过 几 种 方式 加 以 改进 ， 一 种 改进 是 采用 链表 。 另 一 种 则 是 由 于 认识 
到 将 一 个 小 的 集合 合并 到 更 大 的 一 个 集合 会 更 加 有 效 。 为 此 ， 需 要 区 分 用 来 在 数组 R 中 标识 集 
合 的 “内 部 名 ”和 在 UNION 指令 中 提 及 的 “外 部 名 ”。 两 者 都 可 能 是 1 ~n 之 间 的 整数 ， 但 并 不 一 
定 相 同 。 

针对 该 问题 考虑 下 述 数 据 结 构 。 如 前 所 述 ， 使 用 数组 R， 使 R[ BEATE i 的 集合 的 “内 
部 "名 。 现 在 ， 对 于 每 个 集合 4， 构 造 包 含 集合 中 元 素 的 链表 LIST[ 4 ]。 用 两 个 数组 LIST 和 
NEXT 实现 该 链表 。LIST[ 4 ] 为 整数 J/， 表 明 / 是 以 4 为 内 部 名 的 集合 中 的 第 一 个 元 素 。NEXT[D7] 
给 出 在 集合 4 中 的 下 一 个 元 素 ，NEXT[NEXT[ 门 ] 表 示 再 下 一 个 元 素 ， 依 此 类 推 。 

此 外 ， 使 用 数组 SIZE, SIZE[ 4] 表 示 和 集合 4 中 元 素 的 数目 。 同 样 ， 集 合 也 可 以 在 内 部 重 命 
名 。 两 个 数组 INTERNAL_ NAME 和 EXTERNAL_ NAME 分 别 表示 内 部 名 和 外 部 名 。 也 就 是 ， 
EXTERNAL NAME[ 4] 给 出 有 内 部 名 4 的 集合 的 真实 名 字 ( 由 UNION 指令 指定 的 名 字 ) INTER- 
NAL_ NAME[j] 是 拥有 外 部 名 j 的 集合 的 内 部 名 。 内 部 名 就 是 在 数组 R 中 使 用 的 名 字 。 

例 4.6 设 n=8， 且 有 合集 ,包含 三 个 集合 i1,， 3, 5, 71. 12, 4, 8) 和 16| ， 外 部 名 分 别 
为 1、2 和 3。 图 4-13 给 出 这 三 个 集合 的 数据 结构 ， 其 中 ,假定 1、2 和 3 分 别 有 内 部 名 2、3 
和 1。 口 


EXTERNAL 
—NAME 


为 
z 
m 
3 
T 
4 
a“ 
N 
m 


INTERNAL 
集合 (有 外 部 名 ) —NAME 





1= (1,3, 5, 7) 1 


2= {2, 4, 8} 2 





3= {6} 3 


图 4-13 UNION-FIND 算法 的 数据 结构 


与 先前 一 样 执行 指令 FIND(i) ， 参 照 Ri 来 确定 当前 正 包含 元 素 ; 的 集合 的 内 部 名 。 则 EX- 
TERNAL_ NAME[ R[i]] 给 出 包含 i 的 集合 的 真实 名 。 

如 下 执行 形 如 UNION(, J, KK) 的 合并 指令 ( 行 号 对 应 于 图 4-14) 。 

1. 确定 集合 1 和 J 的 内 部 名 (第 1 ~2 行 )。 

2. 参照 数组 SIZE ， 比 较 集合 和 J 的 相对 大 小 (第 3 ~4 行 )。 

3. 遍历 较 小 集合 的 元 素 列 表 ， 在 数组 R 中 改变 相应 项 以 指向 较 大 集合 的 内 部 名 (第 5 ~9 行 )。 

4. 把 较 小 集 元 素 表 添加 到 较 大 集 元 素 表 的 开始 处 ， 将 较 小 集合 与 较 大 集合 (第 10 ~ 12 FF) 
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5. 将 合并 后 集合 的 外 部 名 命名 为 天 (第 13 ~14 FF). 
通过 将 较 小 集合 并 到 较 大 集 ， 可 以 在 与 较 小 集合 的 元 素 个 数 成 比例 的 时 间 内 ， 执 行 UNION 
指令 。 图 4-14 中 的 程序 给 出 了 完整 的 细节 。 





procedure UNION(, J, KY: 
begin 


A = INTERNAL NAME[!]: 
B < INTERNAL NAME[J]: 
wig assume SIZE[A] < SIZE[B] 
otherwise interchange roles of 4 and B in 







RwmyTl 


ELEMENT + LIST[4]; 
while ELEMENT x 0 do 













7. R{ELEMENT] — B; 

8. LAST «~ ELEMENT; 

9. ELEMENT + NEXT[ELEMENT] 

end; 

10. NEXT[LAST] — LIST(B]; 
11. LIST[B] +- LIST[A]: 
12. SIZE[B) + SIZE[A} + SIZE[B}; 
13. INTERNAL_NAME[K] + B; 


EXTERNAL_NAME[B] e K 


Æ 4-14 UNION 指令 的 实现 


514.7. 在 执行 指令 UNION(1, 2, 4) fei, 图 4-13 的 数据 结构 将 变 为 如 图 4-15 所 示 的 数据 
结构 。 LJ 


EXTERNAL 
LIST SIZE —NAME 





INTERNAL 
集合 (有 外 部 名 ) —NAME 


3- (6) 1 





图 4-15 ”执行 UNION 指令 后 的 数据 结构 


定理 4.3 使 用 图 4-14 的 算法 ， 可 以 在 O(n log n) E AR n -1 UNION 操作 (最 大 可 能 数 )。 
A: 由 于 每 个 UNION 的 代价 与 移动 的 元 素数 成 比例 ， 在 被 移动 的 元 素 之 间 按 比例 均 分 每 
个 UNION 指令 的 代价 ， 使 得 对 于 一 个 元 素 ， 每 次 移动 都 会 有 一 个 固定 的 代价 计数 。 主 要 的 观测 


a 
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结果 在 于 ， 每 次 从 列表 中 移动 一 个 元 素 时 ， 它 在 一 个 至 少 两 倍 于 之 前 长 度 的 列表 中 找到 自身 。 因 
此 ， 没 有 元 素 移 动 超过 log n 次 ， 因 此 ， 计 入 任意 一 个 元 素 的 总 代价 是 0(log n) 。 将 计 和 人 到 元 素 
的 代价 相 加 ， 就 得 到 总 代价 O(n log n). 口 

根据 定理 4. 3， 如 果 执 行 m 条 FIND 指令 和 多 达 n -1 条 UNION 指令 ， 那 么 总 的 时 间 消 耗 为 
O(MAX(m, nlogn)), WẸ m 以 n log n 为 阶 或 更 大 ， 则 该 算法 关于 常数 因子 是 最 优 的 。 然 而 ， 
在 许多 情况 下 可 以 发 现 m 是 0(n)， 此 时 ,可 以 得 到 比 OCMAX(m, n log n) ) 更 好 的 结果 ， 在 下 
一 节 将 能 够 看 到 这 一 点 。 


4.7 UNION-FIND 问题 的 树 结构 


对 于 UNION-FIND 问题 ， 上 节 给 出 了 一 个 数据 结构 ， 能 够 在 0(n log n) 时 间 内 处 理 n-1 条 
UNION 指 令 和 O(n log mn) 条 FIND 指令 。 将 集合 的 合集 元 素 表 示 成 一 棵 树 ， 所 有 这 些 树 将 组 成 一 
个 森林 ， 本 节 将 给 出 表示 森林 的 一 个 数据 结构 。 该 数据 结构 将 允许 在 近乎 线性 的 时 间 内 ， 处 理 
O(n) UNION fll FIND 指令 。 

假定 用 一 个 有 根 的 无 向 树 T, 表 示 每 个 集合 4，4 中 的 元 素 对 应 于 TT 中 的 顶点 ， 集 合 的 名 字 同 
树 的 根 联系 。 指 令 UNION(4，B，C) 的 执行 使 7, 的 根 成 为 Ts 的 根 的 一 个 儿子 ， 并 将 Ts 的 根 的 名 
字 改 为 C。 指 令 FIND(;i) 的 执行 在 森林 的 某 棵 树 了 定位 表示 元 素 i 的 项 点， 遍历 从 该 顶点 到 树 了 
的 根 的 路 径 ， 由 此 可 找到 包含 元 素 i 的 集合 的 名 字 。 

使 用 这 一 方案 ， 合并 两 棵 树 的 代价 是 常数 。 然 而 ，FIND(i) 指令 的 代价 与 从 顶点 
i 到 根 的 路 径 长 度 同 阶 。 这 条 路 径 的 长 度 可 能 为 n-1。 因 此 ， 执行 n-1 条 UNION 指 
令 ， 紧 接着 执行 n 条 FIND 指令 ， 代 价 可 能 高 达 0(n )。 例 如 ， 考 虑 下 面 指令 序列 的 
代价 : 


UNION!(], 2, 2) 
UNIONQ, 3, 3) 


UNIONG — 1, n, n) 
FIND(1) 
FIND(2) 


FIND(n) 
BU n -1 条 UNION 指令 得 到 图 4-16 中 的 树 。n 条 FIND 指令 的 代价 正比 于 
| Y - enc 1) 

如 果 能 够 保持 树 的 平衡 ， 则 可 以 减少 代价 。 一 种 实现 方式 是 ， 计 算 每 棵 树 中 的 项 点数， 在 
合并 两 个 集合 的 时 候 ， 总 是 将 较 小 的 树 加 到 较 大 树 的 根 上 。 这 与 上 一 节 所 使 用 的 技术 相似 ， 都 是 
将 较 小 集合 并 到 较 大 集 。 

引 理 4. 1 如 果 在 执行 每 条 UNION 指令 时 ， 顶 点 数 较 少 (任意 约定 ) 的 树 的 根 成 了 较 大 树 的 
根 的 儿子 ， 那 么 在 森林 中 没有 树 的 高 度 会 大 于 等 于 h， 除 非 其 至 少 有 2 个 顶点 。 

证 明 : 证 明基 于 对 的 归纳 。 对 h=0， 假设 成 立 ， 因 为 每 棵 树 至 少 有 一 个 顶点 。 假 定 对 于 
BAF hel 的 值 ， 归 纳 假设 成 立 。 设 了 是 高 为 h 且 顶点 数 最 少 的 一 棵 树 。 则 了 必定 是 通过 合 
并 两 棵 树 7, 和 7 得 到 的 ， 其 中 ,TT 的 高 为 h -1， 并 且 工 的 项 点数 不 多 于 7,。 由 归纳 假设 ,7 至 
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ROAR, BRE TEDA 2AA, ARH TENA 2" UR. O 
使 用 森林 数据 结构 ， 对 于 包含 n 条 UNION 和 FIND 的 指令 序列 ， 考 
虚 其 最 坏 情 况 下 的 执行 时 间 。 所 作 的 修改 是 ， 在 一 条 UNION 中 ， 较 小 树 C-j 
的 根 变 成 较 大 树 的 根 的 儿子 。 没 有 高 度 超过 log n 的 树 。 因 此 ， 执 行 0(n) 
条 UNION 和 FIND 指令 ， 至 多 消耗 0(n log n) 个 单元 的 时 间 。 这 个 界 是 紧 (33 
的 ， 因 为 存在 包含 有 nn 条 指令 的 序列 ， 使 得 消耗 的 时 间 正 比 于 mlog n, 
现在 考虑 算法 的 另 一 种 修改 ， 即 所 谓 的 路 径 压 缩 (path compression) 。 
由 于 在 总 代价 中 ，FIND 指令 的 代价 看 起 来 占 主导 地 位 ， 尝 试 减少 FIND 
指令 的 代价 。 每 次 执行 一 条 FIND 指令 ， 都 遍历 由 顶点 i 到 对 应 树 的 根 r 
的 路 径 。 设 i，v,，v,，…，v,，r 为 该 路 径 上 的 顶点 。 然 后 ， 让 i, v, 
2 ，…，on-1 中 的 每 个 都 成 为 根 的 儿子 。 图 4-17b 给 出 将 FIND(i) 指 令 应 用 
于 图 4-17a 中 的 树 之 后 的 效果 。 
图 4-16 ”执行 UNION 
指令 后 的 树 





图 4-17 路 径 压 缩 的 效果 


对 于 UNION-FIND 问题 ， 包 含 路 径 压 缩 的 完整 树 合并 (tree-merging) 算 法 表述 如 下 。 

算法 4. 3 不 相交 集 的 快速 合并 算法 。 

WA: 由 集合 的 合集 上 的 UNION 和 FIND 指令 组 成 的 指令 序列 r， 集 合 中 的 元 素 通过 取 自 
1 ~n 中 的 整数 组 成 。 集 合 的 名 字 也 假定 为 1 ~n 中 的 整数 ， 初 始 时 ， 元素 i 本 身 处 于 名 为 i 的 
集合 中 。 

输出 : 相应 于 e 中 FIND 指令 的 响应 序列 。 在 找到 o 的 下 一 条 指令 之 前 ， 生 成 每 条 FIND 指 
令 的 响应 结果 。 

方法 : 分 3 个 部 分 来 描述 算法 : 初始 化 、FIND 的 响应 和 UNION 的 响应 。 

l. 初始 化 。 对 每 个 元 素 以 1<i<n)， 创 建 一 个 顶点 v,。 设 定 COUNT[w] =1，NAME[v ] 
=i FI FATHER[»,] =0。 初 始 时 ， 每 个 顶点 2, 本身 是 一 棵 树 。 为 了 定位 集合 i 的 根 ， 构 建 数组 
ROOT, 其 中 ROOT[; ] 指向 vio 为 定位 对 应 元 素 i 的 顶点 ,构建 数组 ELEMENT, 初始 
时 ，ELEMENT[i] =», jo 

2. 执行 FIND(i) Æ 4-18 给 出 相应 的 程序 。 由 顶点 ELEMENT[i] 开 始 ， 沿 着 指向 树 根 的 路 


径 ， 将 碰 到 的 顶点 置 于 一 个 列表 中 。 到 达 根 时 ， 打 印 集合 的 名 字 ， 且 使 在 遍历 路 径 上 的 每 个 顶点 
都 成 为 根 的 儿子 。 
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3. 执行 UNION(i, j, 8 有 ) 。 通 过 数组 ROOT， 找 到 表示 集合 i 和 j 的 树 根 。 然 后 ， 使 较 小 树 的 
根 成 为 较 大 树 的 根 的 儿子 。 如 图 4-19。 口 


make LIST empty; 

v + ELEMENT[i]; 

while FATHER[v] # 0 do 
begin 


add v to LIST; 
v ~ FATHER[v] 
end; 
comment v is now the root; 
print NAME[v]; 
for each w on LIST do FATHER[w] e v 
end 





438 ”执行 指令 FIND) 


wig assume COUNT([ROOT[i]] < COUNT[ROOTU[/]] 
otherwise interchange i and j in 


LARGE < ROOT[j]; 

SMALL «+ ROOT[i]; 

FATHER[SMALL] + LARGE; 

COUNT[LARGE] +- COUNT[LARGE] + COUNT[SMALL]; 
NAME[LARGE] © k; 

ROOT[k] 二 LARGE 





图 4-19 ”执行 指令 UNION(i, j, k) 


接 下 来 证 明 ， 路 径 压 缩 法 相当 大 地 加 快 了 算法 的 执行 。 为 了 计算 这 一 改进 ， 引 入 函数 政和 
G， 使 得 
F(0)=1 
F(i)z2'"". WPFi»0, 


如 图 4-20 中 的 表 所 示 ， 范 数 下 的 增长 非常 快 。 函 数 C) 定义 为 满 
E F(k) zn IS] RR k, PRÉC 6 的 增长 则 非常 慢 。 实 际 上 ， 对 于 所 有 
“实际 的 "mm 值 ， 即 对 所 有 的 n<2°*, G(n) «5, 
现在 证 明 算 法 4.3 可 以 在 至 多 c'nC(n) 时 间 内 ， 执 行 由 cn 条 UNION fl FIND 
指令 组 成 的 指令 序列 og， 其 中 ，c 和 c 为 常量 ，c' 依 赖 于 c。 为 了 简单 ， 假 定 
执行 一 条 UNION 指令 消耗 一 个 “时 间 单 元 ”， 执 行 指令 FIND(i) 消耗 的 时 间 
单元 数 从 标记 为 i 的 顶点 到 包含 该 顶点 的 树 根 的 路 径 上 的 顶点 数 成 比例 9 。 

定义 ”对 于 UNION 和 FIND 指令 组 成 的 指令 序列 g， 可 以 如 下 定义 一 个 
顶点 的 秩 (rank) : 图 4-20 下 中 的 值 








O 在 此 ,“ 时 间 单 元 "对 应 RAM 所 需 的 常数 步 。 由 于 忽略 了 常量 因子 ， 结 果 数 量 级 也 可 以 用 “时 间 单 元 ”来 表示 。 
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1. Mo 中 删除 FIND 指令 ; 

2. 执行 由 UNION 指令 组 成 的 结果 序列 n 

3. 在 最 后 得 到 的 森林 中 ， 顶 点 v 的 秩 就 是 v 的 高 度 。 

现在 来 导出 一 些 与 顶点 的 秩 有 关 的 重要 性 质 。 

引 理 4.2 存在 至 多 n/2' 个 秩 为 r 的 顶点 。 

证 明 : 由 引 理 4.1， 在 执行 o' 得 到 的 森林 中 ， 秩 为 r 的 每 个 顶点 至 少 有 2' 个 后 代 。 由 于 森林 
中 任何 两 个 相同 高 度 的 不 同 项 点 后 代 的 集合 是 不 相交 的 ， 并 且 2' 个 或 者 更 多 的 顶点 至 多 存在 n/2” 
个 不 相交 的 集合 ， 所 以 至 多 有 n/2 4C r 的 顶点 。 口 

推论 不 存在 秩 超过 log n 的 顶点 。 

引 理 4.3 在 执行 o 的 某 个 时 刻 ， 如 果 w 是" HEAR, Mw 的 秩 小 于 wv 的 秩 。 

证 明 : 如 果 在 执行 o 的 某 个 时 刻 ，w 成 为 v 的 后 代 ， 那 么 在 执行 o' 得 到 的 森林 中 ,ww 将 是 o 
的 后 代 。 因 此 ,ww 的 高 度 必定 小 于 » 的 高 度 ， 因 此 w 的 秩 小 于 vw 的 秩 。 口 

现在 将 秩 划 分 为 组 (group)。 将 秩 r 放 人 入 组 G(r) 中 。 例如， 将 秩 0 和 1 放 入 组 0, 秩 2 放 入 组 1， 
秩 3 和 4 放 人 入 组 2, RS ~ 16 放 人 组 3。 对 于 n>1， 最 大 可 能 的 秩 L log n 位 于 秩 组 (rank group) 
G(Llog n]) <G(n) -1 中 。 

考虑 执行 由 cn 条 UNION 和 FIND 指令 组 成 的 指令 序列 og 的 代价 。 执 行 每 条 UNION 指令 为 一 
个 时 间 单 位 的 代价 ，o 中 的 所 有 UNION 指令 可 在 0(n) 时 间 内 执行 。 为 了 限定 执行 所 有 FIND 指 
令 的 代价 ， 使 用 一 个 重要 的 “ 矢 记 ”(bookkeeping) 技术 。 执 行 单条 FIND 指令 的 代价 在 FIND 指令 
本 身 和 在 森林 数据 结构 中 路 径 上 的 实际 移动 过 的 顶点 之 间 进 行 分 摊 。 通 过 对 分 摊 给 所 有 FIND 指 
令 的 代价 进行 求 和 和 ， 并 加 上 分 摊 给 森林 中 所 有 顶点 的 代价 ， 可 以 计算 出 总 的 代价 。 

如 下 计量 执行 FIND(i) 指 令 的 代价 。 设 v 为 从 表示 i 的 顶点 到 包含 i 的 树 根 的 路 径 上 的 一 个 
顶点 。 

1. Wo HH, 或 者 FATHER[v] 处 于 一 个 不 同 于 v WRAP, WH FIND 指令 本 身 计 量 一 个 
时 间 单 位 ; 

2. MR 及 其 父亲 处 于 相同 的 秩 组 中 ， 则 计量 "承担 一 个 时 间 单 位 。 

由 引 理 4. 3， 沿 着 路 径 往 上 ， 顶 点 的 秩 单 调 增 加 ， 由 于 存在 至 多 G(n) 个 不 同 的 秩 组 ， 所 
以 在 规则 1 下 ,不 会 有 FIND 指令 承担 超过 G(n) 个 时 间 单 位 。 如 果 应 用 规则 2， 顶 点 ov 将 被 移 
动 ， 成 为 一 个 秩 大 于 其 父 的 顶点 的 儿子 。 如 果 顶 点 bv 在 秩 组 g >0 中 ， 则 在 v 得 到 位 于 更 高 秩 
组 中 的 父亲 之 前 ， 可 以 移动 wz， 并 计量 至 多 F(g) - F(g -1) 次 。 在 秩 组 0 中 ， 在 得 到 位 于 更 
高 秩 组 中 的 父亲 之 前 ， 可 移动 一 个 顶点 至 多 一 次 。 由 此 ,根据 规则 1, 移动 v 的 代价 将 由 
FIND 指令 来 承担 。 

为 了 得 到 顶点 本 身 的 代价 的 上 界 ， 可 将 秩 组 中 顶点 的 最 大 可 能 代价 乘 以 秩 组 中 的 顶点 数 ， 
并 对 所 有 秩 组 求 和 。 设 W(g) 是 秩 组 g >0 中 的 顶点 数 ， 由 引 理 4. 2: 


F(x) 


N * n/2' 
(8) Du 
neon uu b uu 
x (n2 bL ] 


<n/2e 

<= n/F(g) 
在 秩 组 g >0 中 ,任意 顶点 的 最 大 代价 小 于 等 于 F(g) -Fle-1). Akt, ERM e 中 ， 所 有 顶点 
的 最 大 代价 界 为 n。 很 明显 ， 同 样 的 讨论 也 适用 于 g =0 的 情形 。 由 于 存在 至 多 G(n) 个 秩 组 ， 所 
有 顶点 的 最 大 代价 为 naG(n)。 因 此 ， 处 理 cn 条 FIND 指令 需要 的 时 间 总 数 至 多 cnC(m) 次 分 摊 到 
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FIND 指令 ， 至 多 nG(n) 次 分 摊 给 顶点 。 因 此 ， 有 下 列 定理 。 

定理 4.4 he 为 任意 常数 ， 则 存在 另 一 个 依赖 于 c 的 常数 c ， 使 算法 4.3 能 在 至 多 c'nG(n) 个 
时 间 单 位 内 ， 执 行 由 cn 条 对 个 元 素 的 UNION 和 FIND 指令 组 成 的 指令 序列 o. 

证 明 : 由 上 述 讨论 可 证 。 DH 

如 果 在 序列 o 中 ， 人 允许 有 基本 操作 INSERT. DELETE 以 及 UNION 和 FIND 指令 ， 则 o 仍然 
能 够 在 O(nG(n) ) 时 间 内 执行 。 证 明 留 作 练习 。 

目前 还 不 知道 定理 4. 4 是 否 给 算法 4. 3 的 运行 时 间 提 供 了 一 个 紧 界 (tight bound), SAM, H 
于 理论 上 的 重要 性 ， 本 节 的 余下 部 分 将 证 明 ， 算 法 4. 3 的 运行 时 间 和 不 成 线性 关系 。 为 此 ， 构 
建 一 个 特定 的 UNION 和 FIND 指令 序列 ， 算 法 4.3 需要 多 于 线性 的 时 间 来 处 理 该 序列 。 

为 了 方便 ， 引 和 人 一 个 基于 树 的 新 操作 ， 称 为 局 部 FIND( partial FIND) ， 或 PF。 设 7 为 一 棵 树 ， 
Hho, v, 0, s Ons 2 是 从 顶点 "到 祖先 w 的 一 条 路 径 (w 不 一 定 为 根 ) 。 操 作 PF(v, w)fiiv, 
vy, Vy. cns uL LC DL ex w 的 儿子 。 称 该 局 部 FIND AKA m e 10 v -w, WERE 0), 。 图 4-21b 
给 出 了 对 于 图 4-21a PRET PEO, w) 后 的 效果 。 





图 4-21 局 部 FIND 操作 的 效果 


假设 给 定 一 个 UNION 和 FIND 指令 序列 rc， 当 在 o 中 执行 一 条 给 定 的 FIND HOH, ERR 
树 了 上 定位 项 点 v， 并 跟踪 从 vv 到 树 了 的 根 w 的 路 径 。 现 在 假定 仅 执行 o 中 的 UNION 指令 ， 而 不 
考虑 FIND 指令 ， 其 结果 为 树 的 森林 F。 通 过 在 下 中 定位 由 最 初 的 FIND 指令 所 使 用 的 顶点 v 和 
w, RERIT PFO, w), PRA ERHI o 中 一 条 给 定 FIND 指令 的 效果 。 注 意 ， 顶 点 ww 可 能 
不 再 是 下 中 的 根 。 

为 获取 算法 4.3 运行 时 间 的 下 界 ， 基 于 UNION 指令 序列 来 考虑 算法 的 性 能 ， 接 着 执行 PF， 
这 些 PF 操作 可 以 被 执行 时 间 相 同 的 UNION 和 FIND 指令 所 组 成 的 指令 序列 所 取代 。 从 下 面 特定 
的 树 中 ， 能 够 得 到 特定 的 UNION 和 PF 序列 ， 其 中 ,算法 4. 3 所 消耗 的 时 间 多 于 线性 时 间 。 

定义 ”对 于 上 >0, HTAA, AE 

1, T(E) 的 每 个 叶子 的 深度 为 上 ， 

2. 高 为 的 每 个 顶点 都 有 2 NUT, hel, 

Ak, Tk) 的 根 有 2 个 儿子 ， 每 个 儿子 都 是 7( 上 -1) 副 本 的 根 。 图 4-22 给 出 树 T(2)。 

引 理 4. 4 对 于 任意 的 上 z0， 通 过 UNION 指令 序列 ， 可 以 创建 一 棵 树 (hk), Gr ERU 
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T(k) 的 一 个 子 图 中 。 并 且 ， 在 (kK), BPRODS—HRAR T) 中 的 时 子 。 
A: 对 上 进行 归纳 。 对 于 k=0， 因 为 TORES 

一 个 顶点 ， 引 理 显然 正 确 。 对 于 >0， 要 构造 7T'(k)， 首 

先 构建 2+1 个 7'(k--1) 的 副本 。 选 择 T'(k 一 1) 的 一 个 副 

本 组 成 树 7'(k) ， 然 后 将 其 他 的 副本 逐个 合并 进来 。 最 终 

得 到 的 树 根 有 对 个 儿子 ， 每 个 都 是 有 (上 -1) 的 根 。 
BNA T'OO RIBUS S, Lk) Tk) 中 的 








叶子 数 。 则 
N'(0) =1 图 4-22 fat T(2) 
N'(k) 2 (2 1) N'(k-1), 对 于 上 >1 
并 且 
L(0) =1 
L(k) =2:L(k-1)， 对 于 宕 1 
因此 
II? 
ND = 一 二 一 = SII; XPFERI (4-3) 
IIO! +1) zit 
ER, WFie2, Aln(1+27") «2^7, Bik 
k 1 k 4 1 
mT] 53) >- l2 > -天 (44) 
通过 式 (4-3 ) 和 式 (44) ， 有 
L(k) 2 1 
Nk)? 3° 74 
因此 ， 定 理 得 证 。 口 


考虑 构造 UNION 和 PF 指令 序列 。 首 先 构 建树 有 (5) ， 接 着 在 子 图 T(K) 的 叶子 上 执行 PF 操作 。 
现在 证 明 ， 对 于 每 个 ! >0， 存 在 一 个 上 ， 能 够 在 7( 有 的 每 个 叶子 上 连续 执行 长 度 为 /的 PF 操作 。 

定义 De, L, 上 ) 为 k 的 最 小 值 ， 如 果 用 任意 有 1 个 叶子 且 高 度 至 少 为 1 的 树 取 代 根 的 高 
度 为 hh 的 T(E) 中 的 每 一 棵 子 树 ， 那 么 可 以 对 所 得 树 的 每 个 叶子 执行 长 度 为 c 的 PF 操作。 

引 理 4.5 对 于 所 有 大 于 0 的 c、1 和 h， BM De, 1, h)( 即 它 是 有 限 的 )。 

证 明 : 包含 两 层 归 纳 。 我 们 希望 通过 对 < 的 归纳 来 证 明 结 果 。 但 是 ， 给 定 c -1 的 结果 ， 要 
WEB] c 的 结果 ， 还 必须 对 ! 进行 归纳 。 

归纳 基础 c=1 是 容易 的 。 对 长 度 为 1 的 PF 操作 ， 它 不 会 移动 任何 顶点 ， 因 此 ， 对 于 所 有 的 
lt 和 h, D(1, l, h) =h, 

现在 对 “进行 归纳 。 假 定 对 所 有 的 上 和 户 ， 定 义 D(c - 1, 1, h) 。 必 须 证 明 对 所 有 的 上 和 六 ， 
可 定义 Dc, l, hh)。 为 此 ， 对 1 进行 归纳 。 

对 归纳 基础 ， 证 明 

D(c, l, h) «&D(c - 1, 2", h+1) 

注意 ， 当 ! =1 时 ， 用 子 树 的 一 片 叶子 取代 树 ， 这 些 子 树 的 根 是 T) OE k) 中 高 度 为 h 的 顶 
Ro Wt HRGRRR T) 中 高 度 为 六 的 顶点 集合 。 显 然 ， 在 修改 后 的 树 中 ， 每 片 叶子 都 是 互 中 某 一 
成 员 的 原 有 后 代 。 因 此 ， 如 果 能 够 对 互 的 所 有 成 员 执行 长 度 为 c -1 的 PF 操作 ， 则 肯定 可 以 对 所 
有 叶子 执行 长 度 为 c 的 PF 操作 。 





RE 
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Wk-D(c-1,2"'", h «1), HÆF c 的 归纳 假设 ， 可 知 丰 存在 。 如 果 考 虑 T(E) 中 高 度 为 
h+1 的 顶点 ， 可 以 看 到 每 个 顶点 都 有 2 ALT, BRB NARA. EXE TCR) 中 删除 五 中 顶点 
的 所 有 原 有 后 代 ， 实 际 上 是 对 每 一 棵 根 的 高 度 为 h+1 的 子 树 ， 用 2**!' 片 叶子 取代 高 度 为 1 的 树 。 
HDA, kzD(c - 1,，2*"',h+1) 足 够 大 ， 以 致 可 以 对 所 有 叶子 ( 即 吾 的 成 员 ) 执 行 长 度 为 
c-1 的 PF 操作 。 

现在 ， 为 完成 对 c 的 归纳 ， 必 须 对 ! 进行 归纳 。 特 别 地 ， 我 们 将 证 明 : 

D(c, l, h) &D(c-1, 2**-90Xe-19)2. ptc. 1-1, h)), 对 于 1>1 (4-5) 

要 证 明 式 (4-5), Wk=D(c, l - 1, h), KARUS) 的 右边 。 对 于 TOR) 中 每 个 高 度 为 天 
的 顶点 ， 必 须 找到 一 种 方式 替换 一 棵 包含 ! 片 叶 子 的 树 ， 然 后 对 每 片 叶子 执行 长 度 为 ec 的 PF HR 
作 。 首 先 ， 对 要 取代 树 中 的 叶子 ， 取 1-1 来 执行 PF 操作 。 由 对 /归纳 的 归纳 假设 ， 可 以 对 这 些 
子 树 中 被 取代 树 的 叶子 ， 取 11-1 来 执行 PF 操作 。 

在 对 叶子 的 1-1 执行 PF 操作 后 ， 发 现 每 棵 被 取代 树 的 第 片 叶 子 现在 都 有 一 个 不 同 于 任何 
其 他 被 取代 树 的 第 1 片 叶 子 的 父亲 。 称 这 类 父亲 的 集合 为 如果 可 以 对 父亲 执行 长 度 为 -1 的 
PF 操作 ， 则 可 以 对 叶子 执行 长 度 为 c 的 PF 操作 。 设 5 为 T(k') 中 的 一 棵 子 树 ， 其 根 的 高 度 为 上 。 
很 容易 验证 ,在 7T(k') 中 ，S 有 2”*”“*”? 片 叶子 。 因 此 ， 在 执行 了 PF 操作 之 后 ， 在 5 中 同时 也 在 下 
中 的 顶点 数 至 多 为 2”*"?。 因 此 ，5 的 余下 部 分 可 认为 是 有 2**”? 叶 子 的 一 棵 任意 树 ， 顶 点 在 
Fh, die 和 1 的 妇 纳 假设 ， 式 (4-5 ) 得 证 。 口 

定理 4.5 算法 4.3 的 时 间 复 杂 度 大 于 cn， 其 中 c 是 常数 。 

证 明 : 假定 存在 常数 <， 使 算法 4. 3 可 以 在 不 超过 en 个 时 间 单 位 内 ， 执 行 由 n -1 条 MERGE 
和 ?条 FIND 指令 组 成 的 任意 指令 序列 。 选 择 d >4c, 计算 k= D(d, 1, 1), 3lixt UNION 指令 序 
列 ， 构 造 T'(k) 。 由 于 可 以 对 要 嵌入 的 树 T(E) 的 每 片 叶 子 执行 长 度 为 d 的 PF 操作 ， 且 7(k) 的 叶 
子 由 超过 1/4 的 T' (Kk) 中 的 顶点 组 成 , 该 UNION 和 PF 指令 序列 将 需要 多 于 cn 个 时 间 单 位 ， 
矛盾 。 a 


4.8 UNION-FIND 算法 的 应 用 和 扩展 


现在 已 经 知道 ， 如 何 很 自然 地 在 例 4-1 的 生成 树 问题 中 得 出 由 基本 指令 UNION 和 FIND 所 组 
成 的 操作 序列 。 本 节 给 出 其 他 一 些 使 用 UNION 和 FIND 指令 序列 的 问题 。 第 一 个 问题 涉及 离线 计 
算 ， 也 就 是 说 ， 在 得 到 任何 答案 之 前 ， 可 以 读 取 整 条 指令 序列 。 


应 用 1 离线 MIN 问题 


给 定 指令 INSERT(i) 和 EXTRACT... MIN， 从 初始 为 空 的 集合 5 开始 。 每 当 磁 到 INSERT(i) 
指令 ， 则 将 整数 i 放 入 集合 S 中 。 每 次 执行 EXTRACT... MIN 指令 时 ,在 S 中 查找 最 小 元 素 ， 
并 删除 。 

设 o 为 包含 INSERT 和 EXTRACT. MIN 的 指令 序列 ， 满 足 : 对 每 个 i(1<i<n), INSERT(i) 
指令 最 多 出 现 一 次 。 给 定 序列 o, BRR EXTRACT MIN 指令 删除 的 整数 系列 。 甚 至 在 需要 
计算 输出 序列 的 第 一 个 元 素 之 前 ， 就 已 经 给 定 了 完整 的 序列 oz。， 所 以 该 问题 是 离线 的 。 

可 通过 下 述 方法 来 解决 离线 MIN 问题 。 设 k 为 o 中 EXTRACT MIN 指令 的 条 数 。 可 以 将 o 
5A o,Eo,£o,E--o,Fo,,,, RP, WFi<j<k+1, Ao NAE INSERT 指令 ,EE 代表 一 条 
EXTRACT_ MIN 指令 。 下 面 通过 算法 4. 3 的 集合 合并 算法 模拟 og。 对 此 集合 合并 算法 ， 如 果 N- 
SERT() 指 令 出 现在 子 序列 o, 中 ， 则 通过 让 名 字 为 j(1 <j<k+1) 的 集合 包含 元 素 i 来 初始 化 一 个 
集合 序列 。 若 存在 名 字 为 j 的 集合 ， 则 通过 使 用 两 个 数组 PRED 和 SUCC, Xj 中 的 值 创建 一 个 双 
链接 的 有 序 表 。 初 始 时 ,对 于 1<j<k+1，PRED[j] =j-1, 对 于 0<j<k，SUCC[j] =j+1。 然 
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后 ， 执 行 图 4-23 的 程序 。 


for i — 1 until n do 


j *- FIND(); 
if j < k then 


print i “is deleted by the ”j“th EXTRACT. MIN instruc- 


tion”; 
UNIONG, SUCC[j], SUCCI D; 
SUCC[PRED[/]] ~ SUCC[]: 
PRED[SUCC[/]] 二 ~ PRED[J] 
end 





4-23 ”离线 MIN 问题 的 程序 


显然 ， 该 程序 的 执行 时 间 受 制 于 集合 合并 算法 的 运行 时 间 。 因 此 ， 离 线 MIN 问题 的 时 间 复 
杂 度 为 0(nG(n) ) 。 | 

例 4.8 考虑 指令 序列 o=43E2E1E， 其 中 j 代表 INSERT(j), E (03 EXTRACT... MIN。 因 
E, o, =43, o,=2, 0, =1，o4 为 空 序列 。 初 始 的 数据 结构 为 集合 序列 

1213, 4} 2-212] 3=11 4-26 
首次 执行 for 循环 ， 确 定 FIND(1) =3. Alt, o 中 第 3 条 EXTRACT... MIN 指令 的 结果 为 1。 集 
合 序列 变 为 
1={3, 44 2={2} 4=11| 

此 时 ， 由 于 名 字 为 3 和 4 的 集合 合并 成 了 名 字 为 4 的 单个 集合 ，SUCC[2] 对 应 等 于 4 的 集合 ， 
PRED[4] 对 应 等 于 2 的 集合 。 

接着 用 i=2 执行 下 一 步 ， 确 定 FIND(2) =2。 因 此 , 第 2 条 EXTRACT_ MIN 指令 的 结果 为 
2。 将 名 字 为 2 的 集合 同 其 后 继 集 合 ( 名字 为 4) 合 并 ,得 到 集合 序列 

1213, 4} 4-11, 2] 

最 后 两 步 确定 , 第 1 条 EXTRACT. MIN 指令 的 结果 为 3， 而 4 则 始终 没有 得 到 抽取 。 口 

下 个 应 用 是 深度 测定 问题 ， 它 常 出 现在 汇编 语言 程序 中 标识 符 “ 等 价 性 ”的 问题 中 。 许 多 汇 
编 语言 允许 声明 语句 中 的 两 个 标识 符 表示 相同 存储 位 置 。 如 果 汇 编 器 碰 到 一 条 语句 声明 两 个 等 
价 标识 符 o 和 B， 那 么 它 必须 找到 两 个 集合 5, 和 5S。， 分 别 表示 等 价 于 a 和 8B 的 标识 符 集 ， 并 用 它 
们 的 并 取代 这 两 个 集合 。 显 然 ， 该 问题 可 用 UNION 和 FIND 指令 序列 来 模拟 。 

然而 ， 如 果 更 仔细 地 研究 该 问题 ， 可 以 找到 另 一 种 方法 来 应 用 前 一 节 的 数据 结构 。 在 符号 
表 中 ， 每 个 标识 符 都 有 一 项 ， 如 果 一 组 标识 符 等 价 ， 则 可 以 方便 地 将 与 它们 有 关 的 数据 仅 保 存在 
其 中 一 个 符号 表 项 处 。 这 表明 ， 对 于 每 个 等 价 的 标识 符 集 ， 存 在 一 个 源 点 (origin) ， 用 来 保存 符 
号 表 中 与 集合 有 关 的 信息 ， 每 个 成 员 都 有 一 个 与 源 点 的 偏 移 。 将 标识 符 的 偏 移 加 到 集合 的 源 点 ， 
可 以 找到 该 标识 符 在 符号 表 中 的 对 应 位 置 。 然 而 ， 要 使 两 个 标识 符 集 等 价 ， 还 必须 修改 与 源 点 的 
偏 移 量 。 应 用 2 概要 地 描述 了 偏 移 的 修改 问题 。 


应 用 2 深度 测定 问题 


给 定 包含 两 类 指令 LINK(v, r) 和 FIND_ DEPTH(v) WHORE. Mien, An ROMA 
树 ， 每 棵 包含 唯一 的 顶点 i1<i<n)。 指 令 LINK(v, r) Krh 为 一 棵 树 的 根 ， 且 "为 不 同 的 树 上 
的 顶点 ,使 得 根 r 成 为 顶点 vb 的 一 个 儿子 。v 和 7 位 于 不 同 树 中 且 > 为 根 ， 这 些 条 件 确 保 最 终 得 到 
的 图 仍然 是 一 个 森林 。 指 令 FIND | DEPTH(v) 需 要 确定 并 打印 顶点 v 的 当前 深度 。 
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如 果 用 一 个 常规 的 邻接 表 表示 维护 该 森林 ， 并 以 显 见 的 方法 测定 顶点 的 深度 ， 则 该 算法 的 
复杂 度 将 是 O(n^) 。 但 是 ， 这 里 将 考虑 使 用 称 为 森林 的 结构 代替 原先 的 森林 结构 。 森林 的 唯 
一 目的 是 为 了 可 以 快速 计算 深度 。 给 D 森林 中 的 每 个 顶点 设置 一 个 整数 权重 ,使 得 沿 D 森林 中 
从 顶点 v 到 根 的 路 径 的 总 权重 为 sv 在 初始 森林 中 的 深度 。 对 于 D 森林 中 的 每 棵 树 ， 计 算 树 中 的 顶 
点 数目 。 

起 初 ，D 森林 包含 棵 树 ， 每 棵 树 包 含 与 唯一 的 整数 i(1<i<n) 对 应 的 单一 顶点 。 每 个 顶点 
的 初始 权重 为 0。 

沿 着 从 v BAR r 的 路 径 执行 指令 FIND_ DEPTH(v), Wo, o, 0, v ERIS (o =v, v, =r) 
上 的 顶点 ， 则 


接着 进行 路 径 压 缩 。 使 每 个 v.(1 <i<k -2) 成 为 根 + 的 儿子 。 为 维护 权重 属性 ,对 于 1<i<k, Il 
点 5 的 新 权重 (WEIGHT) VM ER Zi; WEIGHT [vw]。 由 于 可 在 0(k) 时 间 内 计算 新 权重 ， 一 条 
FIND DEPTH 指令 的 执行 时 间 与 FIND 指令 有 相同 的 数量 级 。 
指令 LINK(v, 7r) 的 执行 结果 是 合并 含有 顶点 v 和 7 的 树 ， 再 将 较 小 的 树 合并 到 更 大 的 树 。 设 
7, 和 7 了 分 别 为 D 森林 中 包含 v Ar WE, BoM AH TAT OR, KD 森林 中 的 树 没 有 必要 
同 初始 森林 中 的 树 同 构 ， 在 特殊 情形 下 ，r 可 能 不 是 7. 的 根 。 用 COUNT T 表示 树 T 中 的 顶点 
数 。 需 要 考虑 两 种 情形 。 
情形 1 COUNT(T,) <COUNT(7,)。 使 "为 wv" 的 儿子 。 必 须 调整 也 原先 的 根 ”的 权重 ， 以 便 
沿 着 合并 后 的 树 中 从 w 到 v' 的 新 路 径 正确 计算 7 中 每 个 顶点 w 的 深度 。 为 此 ， 执 行 指 令 FIND 
DEPTH(v) ， 然 后 如 下 操作 : 
WEIGHT[ r’ ]-—WEIGHT| r'] - WEIGHT[»'] + DEPTH(») +1 
因此 ， 通 过 使 * 的 深度 加 1， 使 7 中 每 个 顶点 的 深度 有 效 增加 。 最 终 ， 使 合并 树 的 计数 等 于 
也 和 也 的 计数 之 和 ; 
情形 2  COUNT(T,) < COUNT(T,), 3447 DEPTH(v), ， 而 后 使 * 成 为 二 的 儿子 ， 并 如 下 
BME: 
WEIGHT[ r' ] —WEIGHTÍ r' | + DEPTH(») +1 
WEIGHT[ ' ]-—WEIGHT| »' | - WEIGHT| '] 
COUNT( 7,) €—COUNT( T,) + COUNT( T. ) 
总 之 ， 可 以 在 0(nG(n) ) 时 间 内 执行 0(n) 条 LINK fl FIND. DEPTH 指令 。 


应 用 3 有 穷 自 动机 的 等 价 性 


确定 性 有 穷 自 动机 是 能 够 识别 符号 串 的 一 种 机 器 。 如 图 4-24 所 示 ， 它 包含 一 条 以 方 框 表 示 
的 输入 带 、 一 个 输入 磁头 以 及 一 个 有 穷 状 态 控制 器 。 用 5 元 组 (S$，1，5，s。,， 下 ) 表示 有 穷 自 动机 
M, 其中: 

1. S 为 有 穷 控 制 器 (finite control) 的 状态 集 ; 

2. 7 为 输入 字母 表 (input alphabet) 。 输 入 带 上 的 每 个 方 框 都 包含 1 | | 。| 。 | "^w 
中 的 一 个 符号 ; 

3.8 是 从 Sx7 到 3$S 的 映射 。 如果 65(s，a) 2s', WM 处 于 状态 * A 
输入 头 处 在 符号 a SPAT, M 将 输入 头 右 移 ， 并 进入 状态 s 

4. 5 是 S 中 的 一 个 特定 状态 ， 称 为 开始 状态 (start state) ; 

5. FS 中 的 一 个 特定 子 集 ， 称 为 接收 (或 终止 ) (accepting or fi- 图 4-24 有 穷 自 动机 


输入 磁头 


| s ERRARE 


86 BAF 


nal) 状态 集 。 

用 7* 表示 了 中 所 有 有 限 长 的 符号 串 的 集合 。1* 包含 空 串 e。 按 以 下 方式 扩展 函数 68， 将 Sx 
I+ 映射 到 S: 

1.6(s, €) *5; 

2. 对 1* 中 的 所 有 % 和 I 中 的 a, 6(s, xa) =6(6(s, x), a)。 

如 果 65(s。，x) EF, WAR x 为 MM 所 接收 。M 接收 的 语言 记 为 LC(M) ， 其 为 M 接收 的 字符 
串 集合 。9. 1 节 包 含 更 广泛 的 对 有 穷 自动 机 的 介绍 。 

如 果 对 于 1* 中 的 每 个 x*，6(s,， x) 是 一 个 接收 状态 当 且 仅 当 6(s,,， x) 是 一 个 接收 状态 ， 则 
称 状态 5, Al s, 是 等 价 的 。 

如 果 L(M,) =L(M,)， 则 称 两 个 有 穷 自 动机 M, 和 MM, 是 等 价 的 。 本 节 将 证 明 可 以 使 用 
UNION-FIND 算 法 在 O( nG( n) ) 步 内 测定 两 个 有 穷 自 动机 M, = (5S,, I, ô, s, F) M M, = CS, 
I, &,, s, F,)dét 56, 其中, n= 1S + 15,1. 

状态 等 价 的 一 个 重要 属性 在 于 ， 如 果 两 个 状态 * 和 ' 等 价 ， 那 么 对 于 所 有 的 输入 符号 
a，6(s，a) 和 58(s*'，a) 也 必须 等 价 。 由 于 存在 空 串 ， 接 收 态 不 可 能 等 价 于 非 接收 态 。 因 此 ， 
如 果 初 始 假定 M CRI MM, 的 开始 状态 s, 和 s, 等 价 ， 则 可 以 推断 某 些 其 他 的 状态 对 必定 也 等 价 。 
如 果 这 些 状态 对 中 的 一 个 包含 接收 态 和 非 接收 态 ， 则 s, 和 s, 不 等 价 。 尽 管 没 有 给 出 证 明 ， 
但 是 反之 亦 然 。 

为 测定 两 个 有 穷 自 动机 Mi =(S,, 17, 8,, s, F)HIM, =(S,, I, &, s, F, BBS, A 
以 按 如 下 方式 来 处 理 : 

1. 假定 两 个 初始 状态 * Als, SH, WOR 4-25 的 算法 确定 必定 等 价 的 所 有 状态 集 。LIST 
保存 状态 对 (s，s') ， 其 中 * Ms 已 被 发 现 是 等 价 的 ， 但 是 其 后 继 (5(s，c) ，6(s'， a) ) 的 等 价 性 
尚未 测定 。 初 始 ，LIST 仅 包含 初始 状态 对 (s ，s ) 。 为 找 出 等 价 状态 集 ， 程序 使 用 上 述 关 于 不 相 
交集 合并 算法 。COLLECTION 表示 集合 族 。 初 始 时 ，5,U 5, 中 的 每 个 状态 都 处 于 其 自身 的 集合 中 
(不 失 一 般 性 ， 可 以 假定 5, 和 5, 中 的 状态 是 不 相交 的 ) 。 当 发 现 两 个 状态 s As’ SH, AFH COL- 
LECTION 中 包含 和 s' 的 集合 4 和 4'， 并 将 得 到 的 集合 称 为 4。 

2. 程序 的 其 余部 分 将 COLLECTION 中 的 集合 表示 为 一 个 划分 ， 该 划分 将 5,U 5, 划 分 为 必定 
等 价 的 状态 块 。M, 和 1M: 是 等 价 的 ， 当 且 仅 当 没有 既 包 含 接收 态 也 包含 非 接收 态 的 块 。 


LIST € (5), S3); 
COLLECTION ~ f; 
for each s in S, U S, do add (s) to COLLECTION; 


comment X15; U S, 中 的 每 个 状态 初始 化 一 个 集合 ; 
while there is a pair (s, 5') of states on LIST do 


delete (s, s’) from LIST; 
let A and A’ be FIND(s) and FIND(s’), respectively; 
if A # A’ then 


UNION(A, A’, A); 
for all a in I do 
add (5(s, a), &(s’, a)) to LIST 





图 4-25 假定 % 和 等 价 时 ， 找 出 等 价 状态 集合 的 算法 
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集合 合并 算法 占据 了 大 部 分 算法 的 运行 时 间 ( 作 为 状态 数 n= |S, + tS 站 的 函数 ) 。 由 于 
每 条 UNION 指令 都 使 COLLECTION 中 的 集合 数 减 少 1， 可 能 存在 至 多 n -1 个 UNION, 并 且 开 始 
HAA n DRA. FIND 的 数目 同 LIST 中 状态 对 的 数目 成 比例 。 由 于 除了 初始 状态 对 (s, ，s ) ， 
仅 在 一 条 UNION 指令 之 后 将 一 对 状态 放置 到 LIST 中 ， 因 此 ，FIND 的 数目 至 多 为 nx |o m 
此 ,假定 II 为 常量 ， 则 确定 MEEST 1 所 需要 的 时 间 为 O(nC(n) )。 


4.9 平衡 树 方案 


有 几 类 重要 的 问题 ， 虽 然 它 们 同 UNION-FIND 问题 相似 ， 但 是 讨论 这 些 问 题 仍 需要 回 到 前 面 
用 0(nlogn) 时 间 ( 最 坏 情 形 ) 处 理 n 条 指令 序列 的 情况 。 这 类 问题 之 一 是 处 理由 MEMBER, IN- 
SERT 和 DELETE 指令 所 组 成 的 指令 序列 ， 其 中 总 的 可 能 元 素 比 实际 所 用 元 素 的 数量 更 大 。 在 这 
种 情况 下 ， 无 法 通过 直接 索引 到 指针 数组 来 访问 一 个 元 素 。 必 须 用 散 列 表 ， 或 者 用 二 叉 查 找 树 。 

如 果 插 入 n 个 元 素 ， 散 列 方法 所 需 的 平均 访问 时 间 为 常量 ,但 是 最 坏 情 况 下 每 次 访问 的 时 
间 为 0(n)。 使 用 二 又 查 找 树 时 ， 每 次 访问 的 预期 访问 时 间 为 0(log n)。 但 是 ， 储 车 名 字 和 集合 不 
是 静态 的 ， 二 又 查 找 树 也 可 能 会 得 到 一 个 糟糕 的 最 坏 情 况 访问 时 间 。 如 果 只 是 简单 地 将 名 字 增 
加 到 树 中 ， 没 有 机 制 来 保持 其 平衡 ， 则 最 终 可 能 得 到 一 棵 包含 个 元 素 但 深度 接近 于 n 的 树 。 因 
此 ,在 最 坏 情况 下 二 又 查找 树 每 个 操作 的 执行 时 间 可 能 是 O(n) 。 本 节 提 供 的 技术 将 使 最 坏 情况 
的 执行 时 间 减 少 为 每 个 操作 O(log n) 步 。 

另 一 类 需要 0(nlog n) 时 间 的 问题 用 于 在 线 处 理 ”条 指令 的 序列 ， 其 中 包含 INSERT、DE- 
LETE 和 MIN 操作 。 如 果 需 要 表示 有 序列 表 并 且 执行 列表 的 链接 和 分 离 ， 则 将 产生 第 3 类 类 似 的 
问题 。 

本 节 的 技术 将 允许 在 线 处 理 4. 1 节 所 提 及 的 集合 上 7 类 基本 操作 的 特定 子 集 所 组 成 的 指令 序 
列 。 所 用 基本 数据 结构 为 平衡 树 (balanced tree) ， 树 的 高 度 约 等 于 结 点 总 数 的 对 数值 。 

初始 平衡 树 是 很 容易 构造 的 。 然 而 ， 问 题 在 于 当 执 行 NSERT 和 DELETE 指令 序列 时 ， 如 何 
防止 树 变 成 不 平衡 的 。 例 如 ， 若 执行 DELETE 命令 序列 ， 仅 从 树 的 左边 删除 顶点 ， 最 终 得 到 的 树 
将 左右 不 平衡 。 解 决 方法 是 周期 性 地 重新 平衡 这 棵 树 。 

许多 机 制 可 用 在 必要 的 时 候 重 新 平衡 树 。 其 中 的 几 种 方法 是 让 树 结构 足够 灵活 ， 使 高 为 
的 树 中 顶点 数 处 于 2 到 2*"' 或 3* 的 范围 内 。 在 必须 对 子 树 的 根 做 任何 改变 之 前 ， 这 些 方 法 允许 子 
树 中 的 顶点 数 至 少 增加 为 原来 的 两 倍 。 

接 下 来 讨论 具备 这 种 性 质 的 两 类 特定 方法 : 2-3 树 和 AVL 树 。 处 理 2-3 树 的 算法 在 概念 上 更 
易于 理解 ， 后面 将 进行 讨论 。 处 理 AVL 树 的 算法 与 2-3 树 相 似 ， 可 在 习题 中 找到 。 

定义 2-3 树 (2-3tree) 是 一 棵 树 ， 每 个 非 叶 子 的 结 点 有 2 或 3 个 儿子 ， 且 从 根 到 叶子 的 每 条 
路 径 有 相同 的 长 度 。 注 意 ， 只 包含 一 个 结 点 的 树 是 2-3 树 。 图 4-26 给 出 两 棵 包含 6 片 叶 子 的 2- 
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下 列 引 理 给 出 了 2-3 树 中 顶点 和 叶子 数 同 其 高 度 之 间 的 关系 。 

引 理 4.6 设 了 7 为 一 棵 高 六 的 2-3 树 。7 中 的 顶点 数位 于 2 -1 和 (3 -1)/2 之 间 ， 并 且 
叶子 数位 于 2* 和 3 之 间 。 

证 明 ; 对 有 进行 基本 归纳 。 

通过 把 集合 中 的 元 素 指 派 给 树 的 叶子 可 以 用 一 棵 2-3 树 表示 一 个 线性 有 序 集 So om etd 
示 存 储 在 叶子 ! 中 的 元 素 。 存 在 两 种 基本 的 将 元 素 指派 给 叶子 的 方法 ， 采 用 哪 种 方法 依赖 于 具体 
应 用 。 

如 果 可 能 的 元 素数 目 远 远 大 于 所 用 到 的 实际 元 素数 量 ， 且 将 树 用 作为 字典 ， 那 么 可 以 从 左 
到 右 按 升 序 指派 元 素 。 对 每 个 非 叶 顶 点 v， 还 需 两 类 其 他 信息 L[v] 和 M[v]。L[v] 是 已 分 配给 子 
树 的 S 中 的 最 大 元 素 ， 该 子 树 的 根 为 的 最 左 儿子 ; M[v] 为 已 分 配给 子 树 的 S 中 的 最 大 元 素 ， 
该 子 树 的 根 为 v 的 第 2 个 儿子 。 参 看 图 4-26。 与 顶点 相关 联 的 工 和 及 值 使 得 可 以 从 根 开始 ， 以 一 
种 类 似 于 二 分 搜索 的 方式 查找 一 个 元 素 。 找 到 任何 元 素 的 时 间 同 树 的 高 度 成 比例 。 因 此 ， 如 果 使 
用 具有 该 性 质 的 一 棵 2-3 树 表示 集合 ， 则 可 以 在 O(log n) 时 间 内 处 理 拥有 n 个 元 素 的 集合 上 的 一 
条 MEMBER 指令 。 

将 元 素 指派 到 叶子 的 第 2 种 方法 是 不 对 元 素 分 配 的 顺序 设 限 。 在 实现 指令 UNION 的 时 候 ， 
该 方法 特别 有 用 。 然 而 ， 为 执行 诸如 DELETE 这 样 的 指令 ， 则 需要 有 一 种 机 制 来 定位 表示 给 定 元 
素 的 叶子 。 如 果 集 合 中 的 元 素 是 某 一 确定 范围 内 的 整数 ， 假 定 1 ~n， 则 通过 某 个 数组 的 第 i 个 位 
置 可 以 找到 表示 元 素 i 的 叶子 。 如 果 和 集合 中 的 元 素来 自 于 某 个 大 的 全 集 ， 那 么 可 以 通过 使 用 备用 
字典 来 找到 表示 元 素 i 的 叶子 。 

考虑 下 面 指令 集 : 

1.INSERT, DELETE, MEMBER 

2.INSERT, DELETE, MIN 

3. INSERT, DELETE, UNION, MIN 

4. INSERT, DELETE, FIND, CONCATENATE, SPLIT 

一 般 称 用 来 处 理 集合 1 中 指令 的 数据 结构 为 字典 ; 称 可 处 理 集合 2 中 指令 的 数据 结构 为 优先 
队列 (priority queue); 称 处 理 集合 3 中 指令 的 数据 结构 为 可 合并 堆 ( mergeable heap) ; 称 处 理 集合 
4 中 指令 的 数据 结构 为 可 连接 队列 (concatenable queue) 。 

下 面 证 明 2-3 树 可 用 来 实现 字典 、 优 先 队 列 、 可 连接 队列 以 及 可 合并 堆 ， 并 可 在 0(nlog n) 
时 间 内 处 理 n 条 指令 。 所 用 的 技术 也 完全 能 够 执行 由 本 章 开始 时 所 列 出 的 7 条 指令 的 任何 可 兼容 
子 集 组 成 的 指令 序列 。 唯 一 的 不 兼容 性 体现 在 : UNION 意味 着 无 序 集 ， 而 SPLIT 和 CONCATE- 
NATE 则 意味 着 有 序 集 。 


4.10 ”字典 和 优先 队列 


本 节 将 考虑 实现 字典 和 优先 队列 所 需要 的 基本 操作 。 假 定 按 从 左 到 右 的 顺序 将 元 素 指派 给 
2-3 树 中 的 叶子 ， 且 对 于 每 个 非 叶 顶点 w， 有 工 中 和 Mo] (前 一 节 所 描述 的 “最 大 "后继 函数 ) 。 

为 插入 新 元 素 a 到 一 棵 2-3 树 中 ， 必 须 确定 a 所 对 应 的 新 叶子 ! 的 位 置 。 为 此 ， 尝 试 在 树 中 
定位 元 素 a。 假 定 树 包 含 不 止 一 个 元 素 ， 则 对 a 的 查找 终止 于 顶点 /， 其 中 /包含 两 或 三 片 作 为 儿 
子 的 叶子 。 

AUR f DUREE PET 和 1， 则 使 1 成 为 1 的 儿子 。 如 果 a<E[L]S， 则 使 1 成 为 1 的 最 左 儿 
F, HEL =a 且 M[ 有 =ELL]; MRE) <a<E[4]， 则 使 1 成 为 1 的 中 间 儿 子 ， 并 设 定 





O ELv] 为 存储 在 叶子 v 上 的 元 罕 。 
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Mif] =a; WR ELL] «a, MEIRA f 6058 3 个 儿子 。 在 后 一 种 情形 ， 可 能 需要 改变 某 些 祖 
HÉJ LRM 值 。 


例 4.9 如 果 插 人 元 素 2 到 图 4-27a 所 示 的 2-3 树 中 ， 则 得 到 图 4-27b 所 示 的 2-3 树 。 a 





b) 插入 2 后 


427 插入 元 素 到 一 棵 2-3 树 


现在 假定 f 已 经 有 3 片 叶子 贞 、25 入。 使 /成 为 /中 合适 位 置 的 儿子 。 现 在 顶点 上 有 4 个 儿 
子 。 为 了 保持 2-3 树 的 性 质 ， 创 建 一 个 新 的 顶点 g。 保 留 两 个 / 的 最 左 儿 子 作 为 /的 儿子 ， 但 是 使 
两 个 /的 最 右 儿 子 改变 为 8 的 儿子 。 然 后 ， 通 过 使 g 成 为 顶点 f 的 父亲 的 儿子 ， 使 得 g 成 为 顶点 了 
的 一 个 兄弟 。 如 果 j 的 父亲 有 两 个 此 子 ， 则 到 此 为 止 。 如 果 j/ 的 父亲 有 3 个 儿子 ， 则 必须 递归 地 
重复 该 过 程 ， 直 到 树 中 所 有 的 顶点 至 多 有 3 个 儿子 。 如 果 根 有 4 个 儿子 ， 则 创建 拥有 两 个 新 儿子 
的 新 根 ， 每 个 儿子 拥有 先前 根 的 4 个 儿子 中 的 两 个 。 

例 4. 10 ”如 果 插 人 元 素 4 到 图 4-27a 的 2-3 树 中 ， 会 发 现 标记 为 4 的 新 叶子 应 该 成 为 顶点 c 
的 最 左 儿 子 。 由 于 顶点 “已 经 有 了 3 个 儿子 ， 则 创建 一 个 新 顶点 ce 。 使 叶子 4 和 5 成 为 c 的 儿子 ， 
叶子 6 和 ?7 成 为 的 儿子 。 现 在 使 c' 成 为 顶点 a 的 儿子 。 然 而 ， 由 于 顶点 e 已 经 有 了 3 个 儿子 ， 
因此 创建 男 一 个 顶点 a'o ERA b A e RABKA a 的 上 儿子， 顶点 CURL d 成 为 新 顶点 a' 的 儿子 。 
最 终 ， 创 建新 根 >， 并 使 < 和 a' 成 为 r 的 儿子 。 得 到 的 树 如 图 4-28 所 示 。 口 





图 4-28 在 图 4-27a 的 树 中 插入 4 


算法 4.4 插入 新 元 素 到 一 棵 2-3 树 中 。 

输入 : 一 棵 根 为 7 的 非 空 2.3 树 7， 一 个 不 在 了 中 的 新 元 素 a. 

输出 : 一 棵 修正 后 的 2-3 树 ， 其 包含 标记 为 a 的 新 时 子 。 

方法 : 假定 了 至 少 有 一 个 元 素 。 为 简化 算法 描述 ， 忽 略 对 各 顶点 更 新 二 和 值 的 细节 。 

1. NUR 了 包含 标记 为 上 的 唯一 叶子 1， 则 创建 一 个 新 根 "。 创 建 一 个 标记 为 a 的 新 叶子 v。 
使 1/ 和 vw 成 为 "的 儿子 ， 如果 58<a， 则 使 1 成 为 左 儿 子 ; 否则 ,使 1 成 为 右 儿子 。 
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2. 如 果 了 的 顶点 超过 一 个 , 设 f=SEARCH(a, r), HP SEARCH 为 图 4-29 中 的 程序 。 创 建 
一 个 标记 为 a 的 新 叶子 。 如 果 了 有 两 个 儿子 ,标记 为 和 4b,， 则 使 1 成 为 1 适当 位 置 的 儿子 。 如 
Racb,, 使 1 成 为 左 儿 子 ; MRb,<a<b,, 使 1 成 为 中 儿子 ; 如 果 5, <a, 使 1 成 为 右 儿 子 。 如 
果 f 包 含 3 个 儿子 ， 则 使 1 成 为 1 适当 位 置 的 儿子 ， 然 后 调用 ADDSON(/) 将 f 及 其 4 个 儿子 加 入 
到 了 中 。ADDSON 为 图 4-30 中 的 程序 。 沿 着 从 a 到 根 的 路 径 调 整 L 和 MM 值 ， 来 解释 a 的 出 现 。° 
其 他 对 工 和 MW 值 的 显著 调整 由 ADDSON 来 完成 ( 此 处 略 ， 留 作 练习 ) 。 口 


procedure SEARCH(a, r): 
if any son of r is a leaf then return r 
else 


let s, be the ith son of r; 

if a = Lr} then return SEARCH(a, s,) 

else 
if r has two sons or a = M [r] then return SEARCH(a, s,) 
else return SEARCH(a, 54) 





fi 4-29 SEARCH 程序 


定理 4.6 算法 4.4 插 入 一 个 新 元 素 到 含有 nn 个 叶子 的 一 棵 2-3 树 的 操作 最 多 消耗 O(log n) 
时 间 。 而 且 ， 算 法 保持 了 原 有 叶子 的 顺序 并 保留 了 2-3 树 的 结构 。 

证 明 : 使 新 叶子 成 为 正确 顶点 的 儿子 的 SEARCH 过 程 的 调用 次 数 进行 直接 归纳 。 注 意愿 有 时 
子 的 顺序 并 没有 被 打 乱 。 就 时 间 而 言 ， 由 引 理 4.6 包含 片 叶 子 的 一 棵 2-3 树 的 高 度 至 多 为 log no 
由 于 ADDSON(») (xt » 的 父亲 递归 地 调用 自身 ， 至 多 可 能 有 log n 次 递归 调用 。 由 于 ADDSON 的 每 
次 调用 仅 要 求 常数 时 间 ， 因 而 总 时 间 至 多 为 0(log n)。 口 


procedure ADDSON(v): 
begin 


create a new vertex v'; 
make the two rightmost sons of v the left and right sons of v'; 
if v has no father then 

begin 


create a new root r; 
make v the left son and v' the right son of r 
end 
else 


let f be the father of v; 
make v' a son of f immediately to the right of v; 
if f now has four sons then ADDSON(/) 





É 4-30 ADDSON 程序 


能 够 从 2-3 树 中 删除 元 素 a， 所 用 方法 必然 与 插入 一 个 元 素 相反 。 假 定 元 素 a 是 叶子 ! 的 标 
记 。 考 虑 3 种 情形 。 

情形 1 如 果 ! 为 根 ， 删 除 !( 在 这 种 情况 下 ，a 是 树 中 的 唯一 元 素 ) ; 

情形 2 如果 AAA 3 个 儿子 的 顶点 的 儿子 ， 删 除 1; 





O 仅 需 沿 着 从 开始 的 路 径 ， 直 至 到 达 一 个 顶点 ，a 不 是 以 该 顶点 为 根 的 子 树 中 的 最 大 元 素 。 
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情形 3 如果 i 为 拥有 两 个 儿子 s ML 的 顶点 的 儿子 ， 则 有 两 种 可 能 性 ， 

a) 为 根 。 删 除 ! 和 .F， 保 留 剩 下 的 儿子 s 作为 根 。 

b)f 不 是 根 。 假 定 .有 一 个 兄弟 ge 位 于 其 左 侧 。 当 兄弟 位 于 其 右 侧 时 ， 可 相似 处 理 。 如 果 g 
仅 有 两 个 儿子 ， 则 使 ; 为 g 的 最 右 儿子 ， 删 除 !， 递 归 调 用 删除 程序 删除 f。 如 果 g 有 3 个 儿子 ， 
使 8g 的 最 右 儿 子 为 f 的 左 儿 子 并 从 树 中 删除 1。 

例 4. 11 从 图 4-28 的 2-3 树 中 删除 元 素 4。 标 记 为 4 的 叶子 是 拥有 两 个 儿子 的 顶点 e 的 儿 
子 。 因 此 ， 使 标记 为 5 的 叶子 成 为 顶点 上 的 最 右 儿 子 ， 删 除 标记 为 4 的 叶子 ， 然 后 递归 地 删除 顶 
FA Co 

顶点 。 为 顶点 a 的 儿子 ，e 自己 有 两 个 儿子 。 顶 点 a' 为 a 的 右 兄弟 。 因 此 ， 由 对 称 性 ,使 8 
成 为 o' 的 最 左 儿 子 ， 删 除 顶 点 c， 然 后 递归 地 删除 项 点 a- 

顶点 a 是 树 根 的 儿子 。 应 用 情形 3(a) ;保留 c' 作 为 剩余 树 的 根 ， 如 图 4-31 所 示 。 口 





图 4-31 在 图 4-28 的 树 中 删除 4 之 后 


WT n 个 时 子 的 2-3 树 ， 可 以 在 至 多 O(log n) 步 内 完成 该 过 程 的 执行 。 其 证 明 连 同 删 除 过 程 
的 形式 说 明 一 起 留 作 练习 。 

至 此 ,已 经 证 明了 对 一 棵 含有 个 叶子 的 2-3 树 ， 至 多 需要 O(log n) 步 执行 MEMBER, IN- 
SERT 或 DELETE 指令 。 因 此 ， 一 棵 2-3 树 可 用 来 作为 代价 为 0(nlog n) 的 字典 ， 因 为 它 能 够 在 至 
多 O(nlog n) 步 内 ， 处 理 包 含 n 条 MEMBER, INSERT 和 DELETE 的 指令 序列 。 

现在 考虑 MIN 指令 。 在 一 棵 2-3 树 中 ， 最 小 元 素 位 于 最 左 叶 子 上 ， 肯 定 能 够 在 0(log n) 步 内 
被 找到 。 因 此 ， 任何 含有 nn 条 INSERT, DELETE 和 MIN 指令 的 指令 序列 都 能 够 通过 使 用 一 棵 2-3 
Pd, 在 O(nlog n) 时 间 内 处 理 。 因 此 ， 已 经 验证 了 前 面 声称 的 事实 : 一 棵 2-3 树 可 以 用 来 实现 一 
个 O(nlog mn) 优先 队列 。 其 他 两 个 可 用 来 实现 0(nlog n) 优先 队列 的 数据 结构 是 在 堆 排 序 ( Heap- 
sort) 中 所 用 到 的 堆 ， 以 及 在 习题 4. 30 ~4. 33 中 所 讨论 的 AVL 树 。 


4.131 JAHE 


本 节 给 出 一 个 数据 结构 ， 可 在 0(nlog n) 时 间 内 处 理由 n 条 INSERT, DELETE, UNION 和 
MIN 指令 组 成 的 指令 序列 。 可 认为 该 结构 是 3.4 节 所 讨论 的 堆 的 一 般 化 ， 用 一 棵 2-3 BET 表示 元 
XR $5。S 中 的 每 个 元 素 作 为 了 的 叶子 的 标记 出 现 ， 但 是 ， 不同 于 前 面 两 节 ， 叶 子 不 是 线性 有 序 
的 。 对 于 了 中 的 每 个 内 部 顶点 ， 赋 予 标记 SMALLEST[»], ， 表 示 存 储 在 以 "为 根 的 子 树 中 最 小 元 
素 的 值 。 在 2-3 树 的 这 一 应 用 中 ， 不 需要 LLv] 和 M[v]。 

从 了 的 根 开始 ， 沿 着 树 按 如 下 方式 下 移 ， 可 找到 集合 5 中 的 最 小 元 素 。 如 果 当 前 位 于 内 部 
顶点 w， 接 下 来 访问 SMALLEST 值 最 小 的 v ILF, WRTA n KF, WHS MIN € 
要 0(log n) 步 。 

在 多 数 应 用 中 ， 无 论 何 时 需要 从 $ 中 删除 一 个 元 素 ， 该 元 素 总 是 最 小 元 素 。 然 而 ， 如 果 要 





O 有 共同 父亲 的 两 个 顶点 称 为 元 第 。 
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MS 中 删除 任意 一 个 元 素 ， 则 必须 能 够 找到 包含 该 元 素 的 叶子 。 在 元 素 可 用 整数 1，2，…,， nk 
示 的 应 用 中 ， 可 以 直接 索引 到 叶子 。 如 果 元 素 是 任意 的 ， 可 以 使 用 一 个 辅助 2-3 字典 ， 其 叶子 包 
含 指向 了 中 叶子 的 指针 。 通 过 该 字典 ， 可 以 在 0(log n) 步 内 访问 7 中 的 任意 一 片 叶 子 。 每 当 执 行 
一 条 INSERT 指令 的 时 候 ， 必 须 更 新 字典 ， 这 至 多 需要 O(log n) 步 。 

一 旦 从 了 中 删除 了 一 片 叶子 ， 则 必须 为 ! 的 每 个 特定 的 祖先 "重新 计算 SMALLEST 值 。 
SMALLEST[vw] 的 新 值 将 是 v 的 两 或 三 个 儿子 :中 的 SMALLEST s] ARME. WRAAE AJR HE 
重新 计算 ， 通 过 对 重新 计算 的 次 数 进行 归纳 ， 可 以 证 明 每 次 计算 都 产生 SMALLEST HEMER., 
由 于 在 被 删除 叶子 的 祖先 上 仅 有 SMALLEST 值 发 生 改变 ， 所 以 可 在 0(log n) 步 内 处 理 完 DELETE 
指令 。 

现在 考虑 UNION 指令 。 每 个 集合 都 用 一 棵 不 同 的 2-3 树 表示 。 为 了 合并 两 个 集合 SA 5,， 
调用 图 4-32 的 程序 IMPLANT(T,, T,), HP 7, 和 了 为 表示 S, 和 5, 的 2-3 IP, 

假定 7 的 高 度 h 大 于 等 于 TT 的 高 度 h,。 在 7 的 最 右 路 径 上 ，IMPLANT 找到 高 度 为 h, 的 顶点 
v, f£ T, WR BAB. MR 的 父亲 /现在 有 了 4 个 儿子 ， 则 IMPLANT 调用 程序 ADD- 
SON(f) 。 在 IMPLANT 操作 期 间 ， 后 代 发 生 改 变 的 顶点 的 SMALLEST 值 可 以 用 DELETE 操作 中 一 
样 的 方式 更 新 。 

IMPLANT 程序 可 在 O(h, - hh,) 时 间 内 合并 7T, 和 7 到 一 棵 2-3 树 ， 证 明 留 作 练习 。 当 我 们 计 
AEP LAM 值 的 时 间 的 时 候 ， 程 序 IMPLANT 可 能 需要 用 O(MAX (log | S, |], log | S, || )) 
时 间 。 


procedure IMPLANT(T,, 7;): 
if HEIGHT(T,) = HEIGHT(T,) then 
begin 


create a new root r; 
make ROOT[T,] and ROOT[T,] the left and right sons of r 
end 
else 
wig assume HEIGHT(T,) > HEIGHT(T,) otherwise 


interchange T, and 7, and interchange “left” and "right" in 
begin 


let v be the vertex on the rightmost path of 7, such that 
DEPTH(») = HEIGHTT ~ HEIGHT(T;); 

let f be the father of v; 

make ROOT(T,] a son of f immediately to the right of v; 

if f now has four sons then ADDSON(/)? 





Q) 如 果 使 ADDSON (f) 产生 的 新 顶点 取 值 《和 必须 先 没 着 到 最 右边 叶 
结 点 的 路 径 求 出 v 的 最 大 后 代 


B] 4-32 IMPLANT 程序 


下 面 考虑 一 个 应 用 ， 其 中 UNION, MIN 和 DELETE 的 操作 是 随意 出 现 的 。 

例 4. 12 ”考虑 一 个 算法 ， 其 查找 例 4-1 中 图 的 最 小 代价 生成 树 。 顶 点 存放 到 逐渐 变 大 的 集 
合 中 , 通过 由 最 小 代价 生成 树 选 出 的 边 来 连接 每 个 集合 中 的 成 员 。 为 生成 树 找 出 新 边 就 是 考察 
边 ( 首 先是 最 短 的 ) ， 观 察 它们 是 否 与 尚未 连接 的 顶点 相连 接 。 

另 一 个 策略 是 对 每 个 顶点 集 V, Hii In] 中 中 的 某 项 点 相关 联 的 所 有 未 考虑 的 边 的 集合 已 。 
如 果 选 择 一 条 先前 未 考虑 过 的 边 e， 该 边 与 相对 较 小 集合 V 中 的 某 个 顶点 关联 ， 则 有 很 大 可 能 e 
的 另 一 端 不 在 中 中 ， 可 以 将 。 加 入 到 生成 树 中 。 如 果 e 是 同 站 中 的 顶点 相关 联 的 且 未 考虑 的 最 小 
代价 边 ， 那 么 可 以 证 明 ， 添 加 e 到 生成 树 将 导出 一 棵 最 小 代价 生成 树 。 


O 在 此 ,“ 左 “ 右 " 之 间 的 差异 并 不 重要 ， 但 是 这 种 差异 在 下 一 节 讨 论 可 连接 队列 时 需要 考虑 。 


有 
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为 实现 该 算法 ， 初 始 时 必须 为 每 个 顶点 生成 关联 边 的 集合 。 为 找到 一 条 未 考虑 的 与 顶点 集 
合 中 关联 的 最 小 代价 生成 边 ， 应 用 MIN 操作 符 到 的 未 考虑 边 集 合 E,。 然 后 ， 从 已 中 删除 找到 
Mie. WR e 仅 有 一 端 在 和 中 ， 另 一 端 位 于 不 同 的 顶点 集 V P, RJ UNION VR 及"( 可 用 算法 
4.3 的 数据 结构 来 完成 ) ， 并 将 ER E, UNION, 

可 用 2-3 树 作为 表示 每 个 边 集 ,的 数据 结构 ， 每 片 叶 子 用 一 条 边 及 其 代价 来 标记 。 边 没有 特 
定 顺序 。 每 个 非 叶 子 顶 点 v 赋予 其 任何 后 代 叶 子 的 最 小 代价 ， 记 为 SMALLEST o]. 

开始 时 ， 为 每 个 顶点 创建 一 棵 2-3 树 ， 包 含 每 条 同 该 顶点 相关 联 的 边 。 为 构建 一 棵 这 样 的 
树 ， 从 创建 叶子 开始 。 然 后 ， 将 两 片 叶子 或 三 片 叶子 合并 为 组 ， 以 加 入 高 为 1 的 顶点 ， 其 中 至 多 
有 两 组 包含 两 片 叶 子 。 与 此 同时 ， 为 高 为 1 的 每 个 顶点 ,计算 一 片 后 代 叶 子 的 最 小 代价 。 然 后 ， 
将 高 为 1 的 顶点 两 个 或 三 个 合成 一 组 ， 直 到 某 一 层 上 仅 有 一 个 顶点 ( 即 根 ) 被 创建 。 以 这 种 方式 
构建 一 棵 树 的 时 间 同 叶子 数 成 比例 。 至 此 ， 算 法 其 余 实 现 应 该 已 经 很 直观 了 。 算 法 的 总 运行 时 间 
为 0(e log e) ， 其 中 。 为 总 的 边 数 。 口 


4.12 可 连接 队列 


在 4.10 节 已 经 了 解 到 ， 当 使 用 工 和 对 值 时 ， 对 于 指令 INSERT, DELETE, MIN 和 MEMBER 
中 的 每 一 条 ,使 用 一 棵 包含 片 时 子 的 2-3 树 ， 可 以 在 至 多 0(logn) 步 内 执行 。 现 在 证 明 也 能 在 
O(logn) 步 内 执行 每 条 指令 CONCATENATE 或 SPLIT。 再 次 假定 出 现在 2-3 树叶 子 上 的 元 素 是 从 左 
到 右 按 升序 排列 ， 且 对 于 每 个 顶点 v,， 计算 其 L[v] 和 M[wv] 值 。 

指令 CONCATENATE(S,, S,) 以 两 个 序列 5S, 和 5, 作 为 输入 ， 使 得 5, 中 的 每 个 元 素 均 小 于 S, 
中 的 每 个 元 素 ， 并 以 连接 后 的 序列 5,5, 作 为 输出 。 如 果 用 2-3 树 也 表示 S, 823 WT, RA S, 
那么 想 合并 了 T 和 了 到 一 棵 2-3 树 了 中 ， 可 使 了 包含 各 的 叶子 并 保持 其 原始 上 顺序， 随后 加 入 也 中 
的 叶子 ， 同 时 也 保持 其 原始 顺序 。 为 此 ， 调 用 图 4-32 中 的 IMPLANT(T,, T,)o 

最 后 考虑 一 条 SPLIT 指令 操作 。SPLIT(a，5) 操 作 将 S 划分 为 两 个 集合 $S, = (bI bsa HbeS} 
AS, =161b>a 且 beS}。 为 了 用 2-3 树 实现 该 指令 ， 定义 程序 DIVIDE(a, 7) 将 2-3 树 了 分 离 为 两 
棵 2-3 树 TI 和 了 ,使 得 7 中 的 所 有 叶子 标记 都 小 于 或 等 于 a， 且 7, 中 的 所 有 叶子 标记 均 大 于 a 

所 用 方法 的 非 形 式 化 描述 如 下 。 给 定 一 棵 包含 元 素 a 的 2-3 树 T， 跟 踪 从 根 到 标记 为 a 的 叶 
子 的 路 径 。 该 路 径 将 树 分 离 为 子 树 的 集合 ， 它 们 的 根 为 路 径 中 顶点 的 儿子 ,但 本 身 并 不 在 路 径 
上 ， 如 图 4-33 所 示 。 路 径 左 侧 的 树 为 T'、7, 和 7T,， 以 及 包含 顶点 的 平凡 树 。 右 佩 的 树 为 T. 
T, 和 和 vw,。 





图 4-33 ”分离 一 棵 2-3 树 
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使 用 刚才 所 描述 的 树 连 接 算法 ， 合 并 路 径 左 侧 的 树 和 仅 包含 a 的 树 。 同 样 地 ， 合 并 路 径 右 
侧 的 树 。 图 4-34 给 出 的 程序 DIVIDE 包含 了 具体 细节 。 


procedure DIVIDE(a, T): 


on the path from ROOT[T ] to the leaf labeled a remove ali vertices ex- 
cept the leaf; 

comment At this point T has been divided into two forests—the left 
forest, which consists of all trees with leaves to the left of and including 
the leaf labeled a, and the right forest, which consists of all trees with 
leaves to the right of a; 

while there is more than one tree in the left forest do 


let T’ and T" be the two rightmost trees in the left forest; 
IMPLANT(T', T") 


kd 
while there is more than one tree in the right forest do 
begin 


let T' and T" be the two leftmost trees in the right forest; 
IMPLANT(T', T”) 
end 





@ IMPLANT(T', T) 的 结果 可 考虑 为 左 森 林 中 所 留 下 的 。 类 似 地 ， 当 应 用 于 
右 森 林 中 的 树 时 ，IMPLANT 的 结果 是 右 森 林 中 的 一 棵 树 。 


图 4-34 分离 一 棵 2-3 树 的 程序 


定理 4.7 程序 DIVIDE 以 叶子 a 划分 2-3 BUT, 使 a 左 侧 的 所 有 叶子 与 a 本 身 位 于 一 棵 2-3 
树 ， 且 a 右 侧 的 所 有 叶子 位 于 第 2 标 2-3 树 。 该 程序 耗 时 O(HEIGHT(7) ) ， 而 叶子 的 顺序 不 变 。 

证 明 : 依照 程序 IMPLANT 的 性 质 ， 树 适当 地 重新 装配 如 下 。 通 过 观察 下 述 事实 可 得 到 时 间 
开销 的 结果 。 首 先 ， 对 应 任意 给 定 的 高 度 ， 除 了 高 度 为 0 可 以 对 应 3 棵 树 外 ， 其 他 则 至 多 存在 两 
棵 树 。 当 合并 两 棵 树 时 ， 结 果树 的 高 度 至 多 比 两 棵 原 有 树 高 度 的 最 大 值 大 1。 在 结果 树 的 高 度 比 
每 一 棵 原始 树 的 高 度 大 1 的 情况 下 ， 其 根 的 度 为 2。 因 此 ， 如 果 合 并 高 度 为 h 的 3 棵 树 ， 则 结果 
树 的 高 度 至 多 为 h+1。 因 此 ， 在 重组 过 程 的 每 个 阶段 ， 相 同 高 度 的 树 至 多 存在 3 R. 

由 于 合并 两 棵 不 同 高 度 的 树 所 需要 的 时 间 同 它们 高 度 的 差异 成 比例 ， 且 合并 两 棵 相同 高 度 
的 树 所 需要 的 时 间 为 常量 ， 所 以 重新 合并 所 有 树 的 时 间 ， 与 树 的 数目 加 上 任意 两 棵 树 高 度 的 最 
大 差异 值 的 和 成 比例 。 因 此 ， 所 花费 的 总 时 间 同 原始 树 的 高 度 同 阶 。 L] 

通过 观察 可 以 看 到 ， 利 用 可 连接 队列 ， 能 够 在 OC MAX(log! S, 1 , log! S, | ) ) 时 间 内 将 序 
A 5, 插 入 到 序列 S 中 的 一 对 元 素 之 间 。 如 果 S, =b,, 5, +, bas, S, = a, +, ans S, EH 
人 到 元 素 和 a, 之 间 ， 那 么 可 以 使 用 指令 SPLIT(a,, 5,), BT a 将 8, 划 分 为 两 个 序列 S = 


a, a ÑS” = a; °°, a,o 然后 ， 用 CONCATENATE(S,', $,) 得 到 序列 S, =a, 5, a, 
bis +, bu, HIE CONCATENATE(S,, 5,") 得 到 需要 的 序列 。 
4.13 划分 


现在 考虑 一 种 特殊 的 集合 分 离 ， 称 为 划分 (partitioning) 。 划 分 一 个 集合 的 问题 经 常 出 现 ,在 
此 给 出 的 解决 方案 是 启发 式 的 。 假 定 给 定 一 个 集合 S 以 及 S 的 初始 划分 r, H 5 划分 成 不 相交 的 
块 和 1B,，B,，…，B,| 。 也 给 定 关于 5 的 函数 ./ 任务 是 找到 S 的 最 粗 粒度 (coarsest) (包含 的 块 最 
少 ) 的 划分 ， 称 为 7' =E, Ee, E, ER: 
1.7' 与 7 一 致 ( 即 每 个 EE 都 是 B 的 子 集 ); 
2. EP a Alb BRB f(a) A f(b) MFT EH, 
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将 77' 称 为 与 7 和 Jf 兼容 的 5 的 最 粗 粒 度 划 分 。 

显而易见 的 解决 方案 是 使 用 下 述 方法 不 断 改进 原始 划分 中 的 块 。 设 B8. 为 一 块 。 对 B. 中 的 每 
^ra, KrüE (a). GRIT B,, SAMY f(a) AM f(b) MURR BPN, 元素 a 和 46 放 入 到 相 
同 的 块 中 。 重 复 该 过 程 ， 直 到 不 可 能 进一步 改进 为 止 。 由 于 每 次 改进 都 需要 0(n) 时 间 ， 且 可 能 
存在 0(n) 次 改进 ， 这 种 方法 将 得 到 一 个 O(n’ ) 的 算法 。 事 实 上 ， 这 种 方法 确实 可 能 需要 平方 数 
量 级 的 计算 步 数 ， 例 4-13 可 说 明 该 结论 。 

例 4.13 设 S=i1 2, =, n], Ball, 2, s, n-1} AB, = {nj 为 初始 划分 。 设 /为 5 
WRR, 对 于 1<i<n, f(i) zi «1 Bf(n) 2n, 第 一 次 重复 过 程 时 ,将 B, 划 分 为 {1，2，…， 
n-2|fllin-1i. Bi TAURWE 8, 中 的 每 个 元 素 ， 这 次 重复 需要 n -1 步 。 下 一 次 重复 时 ， 将 11， 
2,，…，n 一 2| 划 分 为 |1, 2, =, n-3] fin -2|。 继 续 按 这 种 方法 处 理 ， 总 共 需 要 n -2 次 重 
复 , 第 i 次 重复 花费 n -i 步 。 因 此 ， 总 共 需 要 的 步 数 为 


$o-n- n _1 


对 于 1<i<n， 最 终 的 划分 得 到 E, = filo 

该 方法 的 困难 在 于 ， 即 使 仅 从 块 中 删除 一 个 元 素 ， 改 进 一 个 块 也 可 能 要 0(n) 步 。 这 里 将 设 
计 一 个 划分 算法 ， 其 中 改进 一 个 块 为 两 个 子 块 所 需要 的 时 间 同 较 小 的 子 块 成 比例 。 该 方法 将 得 
到 一 个 0(nlogn) 的 算法 。 

MFHT BCS, &f'(B) = {8b1f(5) eB), MFaeB,, 不 是 通过 f(a) 的 值 划分 块 B.,， 而 
是 相对 于 B;,， 划 分 包含 至 少 一 个 f°"' (8,) 中 元 素 和 一 个 不 在 /"'(B,) 中 元 素 的 块 B。 也 就 是 说 ， 
每 个 这 样 的 B 都 划分 为 集合 1b1 be BA f(b) e B,] fülb! be BA f(b) e Bl. 

一 旦 关于 8, 进行 了 划分 ， 就 不 需要 再 关于 BHT, RAB ARROW, MRM 
个 元 素 beB, f(b) eB;，B. 分 裂 为 B.' 和 B,”， 则 可 以 关于 B,' 或 B." 对 8B, 进行 划分 。 由 于 ib1 beB, 
Hb) eB/ISET B -ibl be B,Hf(b) eB”, 我们 将 得 到 相同 的 结果 。 

对 关于 BR B“ 的 划分 已 经 有 了 选择 ， 为 此 划分 更 为 容易 的 那个 。 用 f/f" (B; )RfÁ (B) 
更 小 的 那个 进行 划分 。 图 4-35 给 出 了 算法 。 


WAITING < {1,2,..., pk 


qp; 
while WAITING not empty do 
begin 


select and delete any integer i from WAITING; 
INVERSE € f-\(B[i)); 
for each j such that B[j] N INVERSE #6 and 
BU] € INVERSE do 
begin 


qeqth; 

create a new block B{q]; 

B[q] — B[j] N INVERSE; 

BU) + BU] - Bla); 

if j is in WAITING then add q to WAITING 
else 


if [B UU s 18 [q] then 
add j to WAITING 
else add q to WAITING 





图 4-35 ”划分 算法 
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算法 4.5 划分 。 

输入 : 含有 革 个 元 素 的 集合 S， 初 始 划分 mr = |1B[1] +, Bip URRAS: SOS, 

输出 Rta’ ={Bl1], B[2], =, Blqll, 使 得 7' 为 与 7 和 /兼容 的 5 的 最 粗 粒 度 划分 。 

Ak: 将 图 4-35 中 的 程序 应 用 于 mr。 该 程序 忽略 了 某 些 重要 的 实现 细节 。 稍 后 ， 在 分 析 运 
行 时 间 的 时 候 ， 将 讨论 那些 细节 。 L1 

现在 开始 分 析 算 法 4. 5， 假定 其 正确 地 划分 了 5。 设 7 为 集合 5 的 任意 划分 , f 为 5S 的 一 个 函 
数 。 如 果 对 中 的 每 块 B， BABO (T), BABNS'(T) =O, WEEE TCS tr BRS 
的 。 例 如 ， 在 图 4-35 中 第 9 和 10 行 确保 对 于 最 终 的 划分 B[ 让 是 安全 的 ， 这 是 由 于 ， 如 果 对 于 某 
XB, Bnf^" (BLHi]) zz 名， 则 或 者 BCINVERSE， 直 接 可 得 BCf"'(B[i])， 或 者 在 第 9 和 10 行 ， 
B 分 成 两 个 块 ， 一 块 为 /"'(B[ 引 ) 的 子 集 ， 另 一 块 同 该 集合 不 相交 。 

算法 4.5 正确 性 证 明 的 部 分 工作 在 于 ,证 明 最 后 的 划分 粒度 不 会 太 粗 。 即 必须 证 明 下 列 
引 理 。 

引 理 4.7 算法 4.5 终止 后 ， 在 最 终 划 分 7' 中 的 每 块 B 对 7' 是 安全 的 。 

证 明 ; KRE, HTAR BUI, REEERE.: 

在 每 次 执行 图 4-35 中 第 4 ~ 14 行 的 循环 之 后 ， 如 果 ! RE WAITING F}, B ixg, 

那么 存在 列表 9 ，g) ，…，g@i( 可 能 为 空 ) ， 使 得 对 1<i<k， 每 个 g, 都 在 WAITING v, 

且 B[L]UBLg,]U…UB[Lgq,] 对 于 当前 的 划分 是 安全 的 (4-6) 

直观 地 ， 当 从 WAITING 中 删除 块 B[1] 时 , 586 ~ 14 行使 得 B[ /对 于 第 14 行 之 后 的 划分 是 
Ri), BIRREA, BDRM. 4 B[ 门 被 划分 时 ， 一 个 称 为 B[9] 的 子 块 被 放 到 WAIT- 
ING 中 。 另 一 个 子 块 仍然 称 为 B[1] 。 显 然 ， 这 两 个 子 块 的 并 BI) UB[g] 是 安全 的 ， 因 为 它 是 原 
Sch) B[ 1 。 进 一 步 的 划分 产生 了 块 BL g,] ，…，B[ gq ]， 使 得 qu, %, o, ATF WAITING 中 ， 
县 R=B[i] UB[gi]U…UB[g,] 是 安全 的 。 当 从 WAITING 中 删除 某 个 q;, 1 <<is<k 时 , 第 6~14 
行 再 次 使 B[g,] 和 尺 - B[g,] 是 安全 的 。 下 面 将 更 精确 地 给 出 这 些 思想 。 

通过 对 执行 第 4 ~ 14 行 的 次 数 进行 归纳 可 证 明 式 (4-6) 对 所 有 的 ! 都 成 立 。 当 算法 终止 的 时 
候 ，WAITING 为 空 ， 因 此 式 (4-6) 意 味 着 在 最 终 划 分 #7' 中 的 每 块 对 7' 是 安全 的 。 

妇 纳 基础 的 执行 次 数 为 0， 由 于 对 所 有 的 1<l<g=p, 1 在 WAITING 中 ， 于 是 式 (4-6) 显 然 。 

对 于 归纳 步 ， 假 定 在 完成 第 14 行 后 ，! 不 在 WAITING 中 。 如 果 之 前 的 执行 之 后 1 XE WAIT- 
ING 中 ,那么 1 具有 在 第 4 行 中 定义 的 值 i。 易 证 , 第 6 ~14 行 中 的 循环 使 B[ 让 对 于 第 14 行 之 后 
的 实际 划分 是 安全 的 。 在 “安全 ”性 的 定义 之 后 ， 我 们 曾 证 明 过 该 事实 。 

如 果 在 执行 第 14 行 之 前 的 各 语句 执行 之 后 ，i! 不 在 WAITING 中 ， 则 由 归纳 假设 ， 存 在 列表 
q1，92，…，9;， 使 得 对 前 一 阶段 中 的 1!， 满 足 式 (4-6)。 也 可 以 保证 ， 在 第 4 行 ,i1。 

情形 1 不 在 L=iq,，g,，…，9,| 之 中 。 在 第 9 ~10 行 可 以 分 离 为 几 个 块 。 对 于 每 B[ gq,]， 
1<rsk( 即 j=g,) ,将 在 第 8 行 所 创建 的 块 的 下 标 加 入 LL。 由 第 11 行 , LOR WAITING 中 
的 下 标 组 成 。 如 果 B[ 门 本 身 没 有 分 解 ， 则 中 [ 门 以 及 工 中 块 的 集合 仍然 组 成 一 个 对 当前 划分 安全 
的 集合 ， 满 足 式 (46) 。 如 果 8[ 门 被 分 解 ， 也 必须 当 j =1 时 把 第 8 行 选择 的 索引 g LAC L At, 
B[i]U UB [r] 对 于 当前 的 划分 将 是 安全 的 。 


情形 2 i 在 L= 1g,，g,，…，g| 之 中 。 不 失 一 般 性 ,假定 i=g,。 证 明 过 程 大 体 上 类 似 于 情 


形 1, 不 过 在 执行 第 4 ~ 14 行 的 当前 循环 之 后 ，9, 可 能 不 在 WAITING 中 。 然 而 ,我 们 知道 ， 当 前 
划分 的 每 块 8 要么 是 /""(8[g]) 的 一 个 子 集 ， 要 么 同 它 不 相交 。 令 T=B[1]U UBLr]， HPL 


已 按 情形 1 修正 。 如 果 BCf"'(B[g,])， 那 么 肯定 有 BNf (T) =O. MEBNS'(Bla,]) = 2, 
那么 , 或 者 有 BASAT) = 名 或 者 有 BG 广 :(7) ， 其 证 明 同情 形 1 相似 。 
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最 终 ， 当 算法 4.5 终止 时 ，WAITING 必然 为 空 。 因 此 ， 式 (46) 意 味 着 ， 对 于 每 个 !，B [7] 
对 于 最 终 的 划分 是 安全 的 。 口 

定理 4.8 算法 4.5 正确 地 计算 了 与 7 和 了 可 兼容 的 S 的 最 粗 划分 。 

EA: 引 理 4.7 表明 ， 算 法 4.5 的 输出 7' 同 7 和 /是 可 兼容 的 。 需 要 证 明 ，z'“ 的 粒度 是 尽 可 
能 粗 的 。 可 简单 地 对 由 第 9 ~ 10 行 分 离 得 到 的 块 数 进行 归纳 ， 以 证 明 算 法 每 次 进行 这 样 的 分 离 对 
于 可 兼容 性 是 必要 的 。 归 纳 证 明 留 作 练 习 。 口 

为 了 证 明 算 法 4. 5 的 运行 时 间 为 O(n logn), n= 5， 现在 必须 详细 考虑 算法 的 实现 。 证 
明 时 间 开 销 的 关键 在 于 ， 要 证 明 第 6 ~ 14 行 的 循环 怎么 能 够 在 同 || INVERSE || 成 比例 的 时 间 内 执 
行 。 第 一 个 问题 是 ， 在 第 6 行 怎样 有 效 地 找到 j 的 合适 的 集合 。 我 们 需要 一 个 数组 INBLOCK， 使 
得 INBLOCK[ /为 包含 1 的 块 的 索引 。 可 以 在 0(n) 步 内 初始 化 INBLOCK， 并 在 第 9 行 之 后 更 新 ， 
且 其 耗 时 不 超过 在 该 行 创建 列表 B[ gq] 所 消耗 的 时 间 。 因 此 ， 由 于 仅 关心 时 间 复 杂 度 大 小 的 阶 数 ， 
忽略 INBLOCK 的 处 理 是 合理 的 。 

使 用 INBLOCK, 很 容易 在 0( || INVERSE || ) 步 内 构造 一 个 在 第 6 行 中 所 需要 的 j 的 列表 
JLIST。 对 于 INVERSE 中 的 每 个 元 素 a， 如 果 包 含 a 的 块 的 索引 不 在 JLIST 中 ， 则 加 入 该 索引 到 
JLIST。 对 每 个 j， 计 算 在 INVERSE 中 也 在 B[7] 中 的 元 素 的 数目 。 如 果 该 数目 达到 | B[7 门 上 ， 则 
B[j] CINVERSE, WJM JLIST 中 删除 六 

使 用 INBLOCK， 对 于 JLIST 中 的 每 个 j， 也 可 以 构建 一 个 整数 列表 INTERSECTION[j], LAFF 
放 引 门 和 INVERSE 的 交集 。 为 了 从 B[ 站 中 快速 删除 在 INTERSECTION[ 站 中 的 元 素 ， 并 将 其 加 入 
B[q]， 必 须 以 双 和 链表 的 形式 维护 列表 Bf 上 ，1 大 1 和 9， 即 ， 指 针 指向 后 继 和 前 驱 。 

第 9 和 10 行 需要 0( || BL a] |). WF for 循环 的 给 定 执行 ， 找 到 合适 的 7 并 执行 7 ~10 行 
所 耗费 的 总 时 间 为 0( || INVERSE || ) 。 对 第 12 ~ 14 行进 行 验证 ， 易 发 现 如 果 操 作 适 当 ， 相 对 于 
总 时 间 O( | INVERSE || ) ， 它 需要 O( || BL a] || ata. 

现在 仅 需 要 考虑 第 11 行 。 为 快速 地 断定 j 是 否 在 列表 WAITING 中 ， 创 建 另 一 个 数组 IN- 
WAITING[j], FE 0(n) 步 内 初始 化 INWAITING， 并 且 在 第 11 ~ 14 行 中 毫 不 费力 地 对 其 进行 维 
护 。 因 此 ， 有 下 面 的 引 理 。 

引 理 4.8 在 图 4-35 中 第 6 ~ 14 行 的 for 循环 可 以 在 O( || INVERSE || ) 步 内 实现 。 

证 明 : 由 上 面 所 述 。 口 

定理 4.9 可 在 O(n log n) 时 间 内 实现 算法 4.5。 

证 明 : 考虑 一 个 整数 s 所 在 的 块 不 在 WAITING 中 ， 能 够 在 放 入 到 WAITING 中 的 块 中 找到 其 
对 应 的 块 。 在 第 1 行 ， 这 可 能 出 现 一 次 。 在 第 11 行 ， 即 使 *sB[9] ， 这 不 可 能 出 现 ， 因 为 ; 先前 
已 经 处 在 8[ 门 中 ， 且 7 已 经 在 WAITING 中 。 如 果 这 在 第 13 或 14 行 出 现 ， 则 s 处 于 一 块 ， 相 对 于 
包含 s 的 集合 索引 放 人 WAITING 中 时 已 包含 s 的 块 ， 该 块 的 大 小 不 到 后 者 的 一 半 。 可 以 得 到 结 
E, BR s 的 集合 索引 放 人 到 WAITING 中 的 次 数 不 会 多 于 1 +log nw, HR, s 处 于 第 4 行 所 选 
Hk i 中 的 次 数 不 可 能 超过 1+jog n 次 。 

假定 第 6 ~14 行 中 的 循环 每 次 执行 的 代价 成 比例 于 ff"'(s) |, H BLE) PATCH ; 承担 。 存 在 
一 个 常数 <， 对 于 循环 的 执行 ，: 所 承担 的 代价 不 超过 cf""(s) ‖ 。 但 是 ， 前 面 已 经 证 明 ，* 在 选择 
的 B[ 引 中 出 现 的 次 数 不 会 多 于 O(log n) 次 ， 因 此 它 所 负担 的 总 代价 为 0( SCs) xlog n)。 由 于 
ALL es lE CS) | 必定 为 n，for 循环 所 有 执行 的 总 代价 为 O(n log n)。 易 见 ， 算 法 4.5 剩余 部 分 的 
代价 为 0(n) ， 因 此 上 述 定理 得 证 。 L1 

算法 4.5 有 几 种 应 用 。 一 个 重要 的 应 用 是 在 有 穷 状 态 机 中 ， 对 状态 数 进 行 最 小 化 。 给 定 一 个 
有 穷 自 动机 M = (S，1，8，s，F) ， 要 找到 有 最 少 状态 数 的 与 M 等 价 的 自动 机 M'。 对 于 每 个 状 
aS s 和 输入 符号 a，6(s，a) 表 示 M 的 下 一 状态 。 起 初 ，M 的 状态 可 以 划分 为 接收 状态 集 F AE 
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接收 状态 集 S-F, EM 中 最 小 化 状态 数 的 问题 等 价 于 找 出 S 的 最 粗 划分 r'， 该 划分 与 初始 划分 
. {FF，S -下 一 致 ， 如 果 状 态 s 和 :位 于 7' 的 一 块 中 ， 那 么 ,对 于 每 个 输入 符号 a， 状 态 5(s，a) 和 
6(t，a) 也 在 M' 的 一 块 中 。 
该 问题 同 算法 4.5 中 间 题 的 唯一 差异 在 于 , 6 是 从 5 X 1:8] S 的 映射 ,而 不 只 是 从 5 到 5 的 映 
射 。 然 而 ， 可 以 将 5 看 作 是 $ 的 函数 的 集合 15. ，5. ，…，8. | ， 其 中 ， 每 个 8. 都 是 6 对 输入 符号 
a WAR, 
通过 将 元 素 对 (i，6, ) 放 人 集合 WAITING ， 可 以 很 容易 地 将 算法 4.5 修改 为 处 理 这 种 更 为 一 
般 的 问题 。 每 个 元 素 对 (i，6,) 包 含 划分 中 一 块 的 案 引 i， 加 上 该 划分 的 函数 8,。 起 初 ，WAITING 
216, 6,)1i=1 或 2， 且 ae7|， 因 为 初始 划分 {| S-F UERR., ARER, k BUSE 
成 B[j] 和 BLg] ， 每 个 可 能 的 函数 8. 都 以 和 9 来 配对 。 余 下 的 细节 留 作 练习 。 


4.14 KEJA 


图 4-36 总 结 了 本 章 所 讨论 的 各 种 数据 结构 ， 它 们 能 够 处 理 的 指令 类 型 以 及 所 作 的 元 素 所 取 
自 的 全 集 的 大 小 和 元 素性 质 的 假设 。 


对 大 小 为 = 的 集合 处 理 = 条 指令 的 时 间 


Bopp id MEMBER, INSERT, DELETE O(n) O(n’) 


2 二 叉 查 MEMBER, INSERT, 
任意 有 序 集 
DELETE, MIN 


MEMBER, INSERT, 


DELETE,UNION, FIND 
MEMBER, INSERT, 


DELETE,UNION, FIND, MIN 

MEMBER, INSERT, DELETE, 
FIND, SPLIT, MIN, CONCATE- 
NATE 


图 4-36 数据 结构 的 性 质 总 结 


O(n log n) O(n?) 


BS O(nG(n)) BF O(nG(n)) 








O(n log n) 

















习题 


4.1 给 出 4.1 节 中 7 个 基本 操作 的 某 个 子 集 ， 使 该 子 集 足 以 对 n 个 元 素 组 成 的 任 一 序列 进行 排 
序 。 解 释 执 行 从 你 的 子 集中 选 出 的 m” 条 指令 流 的 复杂 度 。 

4.2 假定 元 素 是 字母 时 ,并且 对 于 大 小 m =5 的 表 ， 使 用 如 下 散 列 函 数 : 给 字母 赋值 ，4 的 值 为 

1, B 的 值 为 2， 依 此 类 推 。 将 这 些 字母 “ 值 ” 相 加 ， 将 和 的 值 除 以 5 并 取 余 数 。 在 播 入 串 

DASHER, DANCER, PRANCER, VIXEN, COMET, CUPID, DONNER, BLITZEN 后 ， 给 出 

散 列表 和 列表 的 内 容 。 

将 习题 4.2 中 的 8 个 串 插 人 一 棵 二 叉 查 找 树 。 如 果 要 验证 RUDOLPH 是 否 是 集合 中 的 成 员 ， 

被 访问 的 顶点 序列 是 什么 ? 

证 明 : 如 果 能 够 等 可 能 地 看 到 全 集中 的 所 有 元 素 ， 那 么 图 4-3 中 的 SEARCH 程序 给 出 的 可 

能 期 望 查找 时 间 是 最 小 的 。 

找 出 一 棵 最 优 二 叉 查 找 树 ， 使 元 素 c，5，…, 疡 出 现 的 概率 依次 为 0.1，0.2，0.05，0. 1 ， 

0.3, 0.05, 0.15，0. 05， 且 所 有 其 他 元 素 的 概率 都 为 0。 

证 明 在 算法 4. 2 中 ,， 若 将 图 4-9 第 8 行 中 寻找 m 的 范围 限定 在 从 位 置 7, ,到 位 置 7.,,,, D 
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然 可 以 找到 最 大 值 。 

用 习题 4. 6 的 结论 修改 算法 4.2， 使 其 运行 时 间 为 O(n )。 

通过 证 明 图 4-10 树 构 造 算法 的 正确 性 ， 以 完成 定理 4. 2 的 证 明 。 

完成 定理 4.3 的 证 明 。 

在 从 1 到 -的 = 个 外 部 名 组 成 的 集合 与 包含 整数 1 ~n 的 内 部 名 组 成 的 集合 之 间 ， 构 造 一 
个 接口 使 其 可 以 相互 转换 。 该 接口 必须 满足 :能够 在 两 个 方向 进行 转换 。 假 定 r> > nm。 

a) 设 计 接 口 ， 使 其 具有 良好 的 期 望 时 间 性 能 ; 

b) 设 计 接口 ， 使 其 具有 和 良好 的 最 坏 情 况 性 能 。 

给 出 表示 由 从 1 到 的 整数 组 成 的 子 集 5 的 有 效 的 数据 结构 。 欲 对 该 集合 执行 的 操作 有 : 
1) 从 集合 中 任意 选择 一 个 整数 ， 并 将 其 删除 ; 

2) 将 整数 i 加 入 集合 。 

必须 提供 一 种 机 制 ， 在 S$ 已 经 包含 i 的 情况 下 ， 忽 上 略 加 入 整数 i 到 5 的 请 求 。 该 数据 结构 
必须 满足 : 选择 并 删除 一 个 元 素 的 时 间 和 插入 一 个 元 素 的 时 间 是 不 依赖 于 |] S | 的 常量 。 

用 算法 4. 3 执行 根据 下 列 程序 生成 的 UNION 和 FIND 指令 序列 ， 给 出 由 此 得 到 的 树 。 假 
定 ， 对 于 1<i<16， 初始 时 集合 iH lilo 


for i < 1 step 2 until 15 do UNION(, i + 1, i); 
for i *- 1 step 4 until 13 do UNION(i, i + 2, i); 
UNION(1, 5, 1); 
UNION(?, 13, 9); 
UNION(I, 9, 1); 
for i — 1 step 4 until 13 do FINDO) 

end 


设 为 UNION 和 FIND 指令 组 成 的 序列 ， 其 中 ， 所 有 的 UNION 都 出 现在 FIND 指令 之 前 。 
证 明 : 算法 4.3 执行 oc 时， 执行 时 间 同 o 的 长 度 成 比例 。 

5o 树 为 一 棵 包含 单个 顶点 的 树 。 对 于 i>0， 通 过 使 一 棵 5;_, 树 的 根 成 为 男 一 棵 S,, 树 的 根 
的 儿子 ， 得 到 一 棵 $5, 树 。 证 明 如 下 结论 : 


9) 一 棵 5S. 树 包含 {个 高 为 的 顶点 ; 


b) 对 于 m<n， 通 过 将 5, 树 中 的 每 个 顶点 替换 为 一 棵 5,., 树 ， 可 以 由 一 棵 5S, 树 得 到 一 棵 5， 
树 。 此 时 ， 各 个 顶点 的 儿子 变 成 替换 进来 的 S，, 树 的 根 的 儿子 ; 

c) 一 棵 5, 树 包含 一 个 有 个 儿子 的 顶点 ， 这 些 儿 子 分 别 为 一 棵 8% 树 ， 一 棵 S, 树 ，…， 一 
棵 5,., 树 的 根 。 

为 不 相交 集合 合并 问题 给 出 一 个 算法 ， 使 得 包含 较 少 顶点 (可 任意 打 乱 此 约束 ) 的 树 的 根 

成 为 项 点数 较 大 的 树 的 根 的 儿子 ， 但 不 使 用 路 径 压 缩 。 证 明 : O(n log n) 的 上 界 无 法 再 得 

到 改进 。 即 ， 对 某 个 常数 c 和 任意 大 的 mn， 存在 UNION 和 FIND 指令 组 成 的 序列 ， 其 执行 

需要 cn log n 2b, 

设 T(n) ABT n & UNION All FIND 指令 的 最 坏 时 间 复 杂 度 。 对 于 FIND 指令 ， 使 用 4.7 节 
中 用 了 路 径 压 缩 的 树 结构 ， 但 是 ， 通 过 使 4 的 根 成 为 B 的 根 的 儿子 ， 并 不 考虑 集合 的 大 

小 ,来 执行 UNION(4，B，C) 。 证 明 : 对 于 某 个 常数 k >0, T(n) kn log n; 

证 明 : 对 于 某 个 常数 和 ，T(n) <hn logn, H T(n) 的 定义 同 习题 4. 16。 

证 明 可 以 在 O(nG(n) AIA, SEF RR 1, 2, =, n, 执行 n 条 UNION, FIND, MEM- 
BER, INSERT, DELETE 指令 组 成 的 序列 。 假 定 DELETE(i，5) 使 i 成 为 一 个 新 集合 {让 的 
成 员 ， 可 以 给 该 集合 一 个 (任意 的 ) 名字 。 最 终 这 一 集合 合并 到 另 一 个 集合 。 也 假定 不 会 
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有 元 素 同时 作为 多 个 集合 的 成 员 。 

推广 离线 MIN 问题 ， 处 理 形 如 MIN(i) 的 指令 ， 该 指令 确定 该 MIN 指令 左边 的 未 被 前 一 个 
MIN 指令 所 识别 的 所 有 小 于 i 的 整数 。 

研究 离线 MIN 问题 的 数据 结构 ， 请 用 数组 表示 树 ， 并 基于 数组 编写 程序 ， 不 使 用 对 不 相 
交集 合 进行 合并 算法 的 高 级 命令 。 

按 如 下 方式 推广 离线 MIN 问题 。 设 了 为 一 棵 树 ， 包 含 n 个 顶点 。 每 个 顶点 同 1 ~n 之 间 的 
一 个 整数 相关 联 。 关 联 某 些 顶点 是 EXTRACT. MIN 指令 。 使 用 后 序 遍 历 该 树 。 当 磁 到 顶 
点 v 上 的 EXTRACT_ MIN 指令 时 ， 确 定 并 删除 以 * 为 根 的 子 树 上 先前 没有 删除 的 最 小 整数 
(除了 顶点 "上 的 整数 ) 。 为 该 过 程 给 出 一 个 离线 的 O(nG( 0) ) 算 法 。 

对 于 UNION_ FIND 问题 ， 设 计 一 个 0(n loglog n) 的 解决 方案 ， 使 用 树 数据 结构 ， 此 类 树 
中 的 叶子 到 根 的 距离 为 2。 将 根 的 度 限定 在 1 ~ n/ log n 之 间 ， 根 的 每 个 儿子 的 度 则 限定 为 
1 到 logn 之 间 。 如 何 修改 算法 ,使 其 具有 O(n logloglog n) 的 时 间 上 界 ? 通过 推广 这 种 方 
法 ,可 得 到 的 最 优 时 间 上 界 是 什么 ? 

在 4.8 节 应 用 2 所 提 到 的 符号 表 中 ， 怎 样 从 初始 状态 开始 跟踪 置换 过 程 [提示 : 利用 深度 
测定 中 所 使 用 的 技术 ] 。 

为 4.8 节 应 用 2 中 提 及 的 包含 有 权重 计算 的 UNION 和 FIND 原 语 编写 一 个 程序 。 

用 图 4-25 中 的 算法 ， 测 试 下 面 有 穷 自 动机 的 等 价 性 。 初 始 状态 分 别 为 1 和 4， 终 止 状态 集 
分 别 为 {5} 和 |C，E}。 


ws | 全 了 ons 





编写 完整 的 在 2-3 树 中 执行 下 列 指令 的 程序 。 

a) DELETE; 

b) UNION; 

c)MEMBER( 假 定 叶子 有 序 ， 且 每 个 项 点 以 其 最 高 的 叶子 作为 标记 ) ; 

d) SPLIT( 假定 给 定 了 将 进行 分 离 的 位 置 的 叶子 ， 且 叶子 有 序 ) 

编写 一 个 完整 的 插入 一 个 新 的 顶点 到 一 棵 2-3 树 中 程序 ， 假 定 叶子 有 序 。 

为 原 语 MEMBER, INSERT, DELETE, MIN, UNION 和 FIND 编写 程序 ， 其 中 ， 用 带 有 
4. 11 节 SMALLEST 标记 的 2-3 树 。 假 定 全 集 为 {1, 2, =, nl, 

考虑 可 合并 堆 (INSERT、DELETE、UNION 和 MIN) 的 2-3 树 实现 。 假 定 提取 元 素 的 全 集 足 
够 大 。 描 述 怎样 在 每 条 FIND 指令 用 O(log n) 步 来 实现 FIND， P, n 为 所 包含 的 所 有 堆 
中 的 元 素 总 数 。 
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定义 AVL 树 2 是 一 棵 二 又 查找 树 ， 在 每 个 顶点 E, v 的 左右 子 树 的 高 度 相 差 不 大 于 1。 如 
果 少 一 棵 子 树 ， 则 认为 “高 度 ”-1。 

例 4.14 图 4-37 中 的 树 不 是 一 棵 AVL 树 ， 因 为 

标记 为 * 的 顶点 有 一 棵 高 为 2 的 左 子 树 ， 且 有 高 


度 为 0 的 右 子 树 。 然 而 ， 在 图 4-37 中 ， 其 他 的 
每 个 顶点 都 满足 AVL 条 件 。 口 
证 明 ; 一 棵 高 为 h 的 AVL MESA 2 -1 个 顶 
点 ， 且 至 少 有 
$226 (145) 5 3-25 (1-8 L5) _1 
个 顶点 。 
设 了 为 一 棵 包含 = 个 顶点 的 二 叉 查找 树 ， 且 其 为 图 437 一 棵 非 AVL 树 


一 棵 AVL 树 。 为 指令 INSERT 和 DELETE 编写 0(log n) 的 算法 ， 使 该 树 仍 然 为 一 棵 AVL 
树 。 可 以 假定 ， 在 项 点 上 能 够 找到 每 个 顶点 的 高 度 ， 且 该 高 度 信息 被 自动 更 新 。 

编写 分 割 一 棵 AVL 树 和 连接 两 棵 AVL 树 的 算法 。 算 法 的 执行 时 间 应 同 树 的 高 度 成 比例 。 
用 一 棵 AVL 树 作为 算法 的 基 ， 对 由 整数 1 ~n 组 成 的 集合 执行 MIN、UNION 和 DELETE, 
每 个 操作 使 用 0(log n) 步 。 

定义 ”在 一 棵 二 又 树 中 顶点 ov 的 平衡 度 (balance) 为 (1 + 上 )/(2+L+R)， 其中, LAR Xv 
的 左右 子 树 中 的 顶点 数 。 如 果 每 个 顶点 的 平衡 度 在 w~1-aw 之 间 ， 则 称 一 棵 二 叉 查 找 树 
为 a 平衡 的 。 

例 4. 15 在 图 4-37 中 ， 标 记 为 * 的 顶点 的 平衡 度 为 5/7。 没 有 其 他 顶点 的 平衡 度 值 的 偏 
差 大 于 1/2， 因 此 ， 图 4-37 中 的 树 为 277 平衡 。 口 
对 于 一 棵 高 为 A 的 a 平衡 树 ， 给 出 其 顶点 数 的 上 下 界 。 

对 于 平衡 度 为 a 的 树 ， 重 作 习题 4.31 ~4.33， 其 中 ,a<1/3。 

如 果 a >1/3， 能 重 作 习 题 4.31 ~4. 33 吗 ? 

通过 叶子 上 的 数据 设计 一 棵 平衡 树 ， 通 过 将 子 树 高 度 的 差异 保持 在 固定 常数 内 ， 来 得 到 
平衡 。 

给 定 一 棵 个 顶点 的 树 以 及 包含 n 对 顶点 的 列表 ， 编 写 一 个 O(nG(n) ) 的 算法 ， 为 每 个 顶 
AXo, w), HEX o 和 w 共同 祖先 的 顶点 ， 且 该 顶点 为 v 和 w 所 有 这 类 共同 祖先 中 
最 近 的 。 

二 叉 树 的 外 部 路 径 长 度 为 其 深度 的 所 有 叶子 之 和 。 二 叉 树 的 内 部 路 径 长 度 为 所 有 顶点 的 
深度 之 和 。 如 果 每 个 顶点 都 有 两 个 儿子 ， 或 者 没有 儿子 ， 那 么 ， 外 部 与 内 部 路 径 长 度 之 
间 有 什么 关系 ? 

设计 一 个 数据 结构 来 实现 队列 ， 以 使 得 下 列 操作 能 够 在 线 执行 。 

a) ENQUEUE(i, A): 将 整数 i 添加 到 队列 A 中 。 人 允许 相同 的 整数 有 不 同 的 实例 。 

b) DEQUEUE(A): 从 队列 4 中 提取 出 其 中 最 长 的 元 素 。 

c)MERGE(A, B, C): 合并 队列 4 和 8B8， 将 得 到 的 队列 称 为 C。 如 果 元 素 在 队列 4 或 B 中 
出 现 ， 则 它们 认为 会 出 现在 合并 后 的 队列 中 。 注 意 到 ,在 4 和 8B 中 ， 同 样 的 整数 可 能 会 
出 现 多 次 ， 每 一 次 出 现 都 认为 是 一 个 可 区 分 的 元 素 。 





日 ”以 其 创始 者 Adel‘ son-Vel' skii 和 landis[ 1962 ] 命名 。 
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对 于 一 个 包含 n 条 指令 的 序列 ， 其 需要 的 执行 时 间 是 什么 ? 

*4.41 设计 一 个 数据 结构 ， 离 线 实现 习题 4. 40 中 的 操作 。 离 线 执行 包 含 n 条 这 类 指令 的 序列 ， 
需要 的 执行 时 间 为 多 少 ? 

*4.42 在 算法 4. 5 中 ， 假 定 初始 划分 = 1B8,，…，B,| 具 有 这 样 的 属性 ， 对 于 每 个 1<i<g， 有 
某 个 j, E(B) GBo WH: 在 图 4-35 的 第 6 行 ， 至 多 能 选择 一 个 j。 通 过 这 一 简化 ， 
算法 4. 5 的 时 间 复 杂 度 减少 了 吗 ? 


研究 性 问题 


4.43 从 4.1 节 中 给 定 的 7 个 操作 或 者 其 他 相关 的 原 语 中 选择 n 个 操作 执行 序列 ， 关 于 可 以 多 快 
地 执行 这 样 的 序列 ， 还 存在 许多 未 决 的 问题 。 如 果 从 任意 的 集合 中 选择 元 素 ， 获 取 与 它们 
有 关 的 信息 的 唯一 方式 是 通过 比较 ， 那 么 对 于 任意 的 原 语 集合 ， 不 管 以 何 种 方式 排列 ， 其 
执行 时 间 必 定 为 0.(n log n) 。 然 而 ， 当 全 集 为 整数 集 11，2，…，zmj} (或 者 对 于 固定 的 ， 
范围 为 1 ~ ) 时 ,或 者 当 原 语 集 合 不 是 充分 有 序 时 ， 对 于 需要 多 于 O(n) 时 间 的 事情 ， 则 
鲜 有 评论 。 因 此 ， 对 于 图 436 所 给 出 的 期 望 或 最 坏 情况 时 间 ， 还 有 许多 地 方 吸 待 改进 。 
换 名 话说， 基于 整数 1 ~ n， 对 于 原 语 的 某 个 子 集 (或 全 部 )， 能 够 给 出 优 于 O(n) WE 
界 吗 ? 


文献 及 注释 


关于 散 列 表 技 术 的 文献 有 Morris[ 1968], Aho 和 Ullman[ 1973] 以 及 Knuth[1973a]。 后 者 也 
包含 了 关于 二 义 查 找 树 的 信息 。 构 建 静 态 二 又 查找 树 的 算法 4.2 源 自 Gilbert 和 Moore[ 1959] Xt 
于 相同 问题 的 0(m ) 算 法 可 以 在 Knuth[1971] 中 找到 ， 也 可 以 在 其 中 找到 习题 4.6 的 解答 。Hu 和 
Tucker[ 1971] 证 明了 用 O(n’ ) 时 间 和 0(n) 空 间 足 以 构建 一 棵 最 优 二 又 查 找 树 ， 其 数据 仅 出 现在 
叶子 上 。Knuthf 1973a] 证 明了 可 在 O(n log n) 时 间 内 实现 该 算法 。 

Reingold[ 1972 ] 给 出 了 许多 基本 的 集合 操作 ， 如 并 和 交 的 最 优 算法 。 显 然 ，M. D. Mellroy 和 
R. Morris 最 先 使 用 了 算法 4.3 中 的 UNION... FIND 操作 。Knuth[ 1969] 认 为 路 径 压 缩 是 由 A. Tritter 
提出 的 。 定 理 4. 4 来自 Hopcroft 和 Uliman[ 1974] ， 定 理 4.5 则 由 Tarjan[ 1974] 提 出 。4.8 节 中 讨 
论 的 标识 符 等 价 性 和 替换 计算 的 应 用 来 自 Galler 和 Fischer 1964] 。 关 于 有 穷 自动 机 等 价 性 的 应 
用 3 出 自 Hopcroft 和 Karp[1971]。 习 题 4. 16 和 4.17 是 关于 未 使 用 路 径 压 缩 的 算法 4.3 的 复杂 
性 ， 分 别 出 自 于 Fischer[ 1972 ] 和 Paterson[ 1973] 。 

Adel’ son-Vel’ skii 和 Landis[ 1962] 提出 了 AVL 树 。 可 以 在 Crane[ 1972] 中 找到 习题 4. 31 和 
4.32 的 解答 。 有 界 平衡 树 的 概念 来 自 Nievergelt 和 Reingold[ 1973], ， 对 于 习题 4. 34 ~ 4. 37 ， 读 者 
可 以 查阅 该 参考 书 。 可 以 在 Ullman[ 1974 ] 中 找到 使 用 2-3 树 的 一 种 扩展 。 

习题 4. 22 对 UNION-FIND 问题 给 出 了 一 个 早期 的 解决 方案 ， 这 可 以 在 Stearns 和 Rosenkrantz 
[1969] 中 找到 。 习 题 4. 38 则 出 自 Aho, Hopcroft 和 Ullman[ 1974] 。 

在 线 和 离线 算法 的 差异 可 参见 Hartmanis, Lewis 和 Steams[ 1965], 。Rabinf 1963 ] 研究 了 一 种 
重要 的 受 限 在 线 计 算 形 式 ， 称 为 实时 计算 。 

划分 算法 取 自 Hopcroft[ 1971] ， 有 限 自动 机 中 状态 最 小 化 的 应 用 也 取 自 于 此 。 








第 5 章 图 € 法 


工程 与 科学 领域 中 的 众多 问题 都 可 以 用 无 向 或 有 向 图 表示 。 本 章 将 讨论 一 些 主要 的 图 问题 ， 
其 解决 方案 (在 运行 时 间 上 ) 与 图 的 顶点 数 呈 多 项 式 关 系 ， 因 此 也 与 图 的 边 数 多 项 式 旦 关系。 这 
里 将 重点 考虑 图 连通 性 的 处 理 。 本 章 包括 寻找 生成 树 、 双 连通 分 支 、 强 连通 分 支 以 及 顶点 间 路 径 
的 算法 。 第 10 章 将 研究 更 难 的 图 问题 。 


5.1 最 小 代价 生成 树 


RCV, 5) 为 连通 无 向 图 ， 边 依据 代价 函数 映射 到 实数 。 在 V 中 ， 生 成 树 指 的 是 连通 所 
有 顶点 的 无 向 树 。 生 成 树 的 代价 就 是 各 边 的 代价 之 和 。 我 们 的 目标 是 要 为 C 找到 一 棵 具有 最 小 
代价 的 生成 树 。 一 般 对 于 具有 。 条 边 的 图 ， 可 以 在 O(e log e) 时 间 内 找到 一 棵 最 小 代价 生成 树 。 
如 果 较 之 于 顶点 数 。 足够 大 ， 可 在 Oe) 时 间 内 找到 这 样 的 生成 树 ( 见习 题 5.3) 。 许 多 生成 树 算 
法 都 是 基于 下 列 两 个 引 理 。 

引 理 5.1 设 C=(V，E) 为 连通 无 向 图 ， HS- (V, 7) 为 CG 的 一 棵 生成 树 ， 则 

a) 对 V 中 所 有 的 v 和 %， 在 S 中 的 wv 和 之 间 的 路 径 是 唯一 的 ; 

b) ARE E -了 中 的 任何 边 加 入 5 中 ， 则 产生 唯一 回路 。 

证 明 : 如 果 存在 多 于 一 条 路 径 ， 则 存在 一 个 回路 ， 因 此 ，(a) 是 显而易见 的 。 

因为 在 所 添加 边 的 两 个 端点 之 间 必 定 已 经 存在 一 条 路 径 ， 所 以 (b) 也 是 显然 的 。 o 

2195.2 设 6 = (Y，) 为 连通 无 向 图 ，e HRW EMR, MERI, BEL, T), 
(V, T), c, Ver TOUS CEBEEGUE RUE. STU To 假定 e= (v, w) HE- TPRI 
最 小 的 一 条 边 ， 满 足 ve VAlwev,, WEE 6 的 一 棵 生成 树 ， 包 括 TU |e| ， 其 代价 与 G 中 包含 
T 的 任何 生成 树 一 样 低 。 

证 明 ; 反之 , BES =(V, 7') 为 C 的 一 棵 生成 树 , TURA T, EUR A e, 且 5' 的 代价 低 
于 6 中 含有 边 集 FU |e} 的 任何 生成 树 。 

由 引 理 5. 1(b) ， 加 入 e 到 $' 中 形成 一 个 回路 ， 如 图 5-1 所 示 。 访 
回路 必然 包含 不 同 于 边 。 的 边 。 = (o, w), f v eV, Hw eV, 
由 假设 ，c(e) <c(e')。 

考虑 图 5， 它 通过 向 Shim AGH e 并 删除 边 e 而 得 到 。 由 于 删除 
边 e 时 ,破坏 了 唯一 的 环 ， 所 以 $ 无 环 。 而 且 , YES 中 必 与 好 之 间 存 
在 一 条 路 径 ， 因 而 ,中 的 所 有 顶点 仍然 是 连通 的 。 因 此 ，S C 的 
一 棵 生成 树 。 因 c(e) <c(e') ，8 的 代价 不 会 高 于 S'。 但 是 ，5 包含 了 
He, 5 8' 最 小 相 矛 盾 。 " 

现在 给 出 一 个 为 无 向 图 G = (V，E) 找 到 一 棵 最 小 代价 生成 树 的 算 
法 。 该 算法 本 质 上 与 例 4. 1 中 的 算法 类 似 。 该 算法 维护 着 一 个 由 不 相 EST 图 6 中 的 回路 
交 的 顶点 集 所 组 成 的 集合 VS, VS 中 的 每 个 集合 到 皆 表 示 一 个 顶点 的 连通 集 ， 在 用 VS 表示 的 生 
成 森林 中 ， 这 些 顶点 组 成 一 棵 生成 树 。 算 法 以 代价 增 序 ， 从 无 中 选 择 边 。 依 次 考虑 每 条 边 (，， 
w), ID o Al w 已 经 处 于 VS 中 的 相同 集合 内 ， 则 放弃 这 条 边 。 如 果 。 和 位 于 不 同 的 集合 WA 
V, (意味 着 VW, 和 W RER) 中 ， 则 将 E 取 , 合 并 到 一 个 集合 ， 并 将 (wy，z) 加 入 最 终生 成 树 的 
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边 集 合 了 7 中。 可 以 使 用 4. 7 节 中 的 不 相交 集合 合并 的 算法 。 由 引 理 5. 2 以 及 对 所 选择 边 数 的 简单 
归纳 可 知 ， 对 于 6， 至 少 有 一 棵 最 小 代价 生成 树 将 包含 这 条 边 。 

算法 5.1 最 小 代价 生成 树 ( Kruskal 算法 ) 。 

输入 : 无 向 图 C= (Y, 互 ) ， 以 及 边 上 的 代价 函数 co 

输出 : C 的 最 小 代价 生成 树 S= (了 Y，7) 。 

方法 ; 图 5-2 给 出 的 程序 。 ， 口 


begin 
Td, 
VS — 8: i 
construct a priority queue Q containing all edges in E; 
for each vertex v € V do add {v} to VS; 
while ||VS|| > 1 do 
begin 


Choose (v, w), an edge in Q of lowest cost; ‘ 
delete (v, w) from Q; 
if v and w are in different sets W, and W, in VS then 


replace W, and W, in VS by W, U W,: 
add (v, w) to T 








53 包含 边 代 价 的 无 向 图 
例 5.1 考虑 图 5-3 的 无 向 图 。 各 条 边 按 代价 的 递增 顺序 排列 如 下 ; 








当然 ， 实 际 上 并 未 按 算法 5. 1 中 的 步骤 3 对 边 排序 ， 而 是 将 它们 保存 在 一 个 堆 、2-3 树 或 是 
其 他 合适 的 数据 结构 中 ， 一 直到 需要 它们 的 时 候 为 止 。 事 实 上 ， 实 现 优先 队列 ，3. 4 节 中 的 堆 是 








A £X x 105 


一 个 理想 的 选择 。 在 第 6 行 中 ， 重 复查 询 最 小 的 代价 边 是 堆 排 序 的 基本 操作 。 而 且 ， 为 了 构造 一 
BUENO, TES 6 TRH UHR RDF Elo EKA, HFA E ATTER 
排序 ， 从 而 节省 了 时 间 。 

最 初 ， 在 VS 内， 每 个 顶点 自身 位 于 一 个 集合 中 。 最 低 代价 的 边 为 (v, ，z ) ， 因 此 ， 将 该 边 
添加 到 树 中 ， 合 并 VS PHRA Ini Ain) REZBA, 4). BUF v Flo fF VS 内 的 不 同 
集合 中 , H(o,, 4 MABE, HAAHRA ni Aly}. RWE, WAO, n), EHRE 
io] Sis, «1. AWAR 4 RAC, n), HAH Iv, vy, 0, Alo, vds 

EFTER, v). v o [ETE ATRE Ivi, 0, n, 4, s) Po Alt, FE-RM, 
到 的 路 径 ， 包 含 已 经 位 于 生成 树 中 的 边 ， 所 以 没有 必要 加 入 (bv, ,sv，)。 图 5-4 中 简要 给 出 了 整 
个 的 步骤 序列 。 最 终 得 到 的 无 向 生成 树 如 图 5-5 所 示 。 口 


VS 中 的 集合 〈 连 通 分 支 ) 
{vis va}, {va}, {va}, {va}, {vs}, {ve} 


{vi wb {Ve}, (vs va}, {vs}, {ve 
{vis Vor Va}, (9s. v4}, {vs}, {Ve} 
{Vis Ves Vss Var Vel, {Vs}, {ve} 


Vas Vss Vas Vas V7}, {Ve} 





图 54 构造 生成 树 的 步骤 序列 图 5-5 最 小 代价 生成 树 


定理 5. 1 如 果 图 C 是 连通 的 ， 则 用 算法 5.1 查找 最 小 代价 生成 树 。 车 在 第 5~10 行 的 循环 
中 验证 d 条 边 ， 所 消耗 的 时 间 为 O(dloge) ， 其 中 e= | El. Bi, 35.12 £X O(eloge) 
时 间 。 

证 明 : 第 8 和 9 行 正确 地 使 得 顶点 位 于 相同 的 集合 中 ， 当 且 仅 当 它们 位 于 用 VS 表示 的 生成 
森林 的 同一 棵 树 中 。 由 该 事实 及 引 理 5. 2 ， 可 判定 算法 的 正确 性 。 

对 于 时 间 ， 假 定 第 5 ~ 10 行 循环 需要 d 次 迭代 。 如 果 用 优先 队列 实现 @， 则 在 Q 中 查找 一 条 
最 小 代价 边 (第 6 行 ) 需 要 0O(loge) 步 。 如 果 使 用 不 相交 集合 合并 的 快速 算法 ， 找 到 所 有 包含 ， 和 
w 的 集合 WA Ww, CR S 行 )， 并 用 它们 的 并 取代 它们 (第 9 行 ) 所 需要 的 总 时 间 至 多 为 0(eC(e) ) 。 
显然 ， 循 环 的 余下 部 分 要 求 与 C 的 大 小 不 相关 的 常数 时 间 。0 的 初始 化 需要 0(e) 时 间 ，W 的 初 
始 化 需要 0(n) 时 间 ， 其 中 为 V 中 的 顶点 数 。 口 


5.2 深度 优先 搜索 


考虑 按 如 下 方式 访问 一 个 无 向 图 的 顶点 。 选 定 并 “访问 "起 始 顶点 v。 然 后 选择 任意 以 ”为 起 
点 的 边 (v，w) ， 并 访问 w。 一 般 假 定 x 为 最 新 访问 过 的 顶点 。 选 择 以 * 为 起 点 ， 且 之 前 未 曾 出 现 
的 边 (*，7y) ， 继 续 搜索 。 如 果 y 之 前 访问 过 ， 则 找到 另 一 条 以 * 为 起 始点 的 新 边 。 如 果 y 之 前 未 
访问 过 ， 那 么 访问 y 并 以 y 为 起 点 进行 新 的 搜索 。 在 通过 所 有 以 y 为 起 始 的 路 径 完 成 搜索 之 后 ， 
搜索 返回 到 最 先 到 达 y 的 顶点 x。 选 择 以 x 为 起 点 且 未 曾 出 现 的 边 ， 继 续 该 过 程 直到 列表 中 的 边 
都 已 用 尽 。 这 种 访问 无 向 图 项 点 的 方法 称 为 深度 优先 搜索 ， 因 为 该 搜索 尽 可 能 以 前 向 (更 深 ) 方 
式 进行 。 

也 可 以 将 深度 优先 搜索 应 用 到 一 个 有 向 图 中 。 如 果 图 是 有 向 的 ， 则 在 顶点 * 处 仅 选择 从 * 出 
发 的 边 (x*，y) 。 在 耗 尽 所 有 从 y 出 发 的 边 之 后 ， 即 使 存在 其 他 指向 y 且 还 没有 搜索 到 的 边 ， 也 返 
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回 到 xo 

如 果 将 深度 优先 搜索 应 用 到 连通 无 向 图 ， 则 可 以 看 到 图 中 每 个 顶点 都 将 被 访问 ， 且 每 条 边 
都 将 被 检查 。 如 果 图 不 是 连通 的 ， 则 搜索 到 的 将 是 图 的 连通 分 支 。 当 搜索 完 一 个 连通 分 支 之 后 ， 
选择 一 个 尚未 访问 过 的 顶点 作为 新 的 起 始 顶 点 ， 并 开始 新 的 搜索 。 

无 向 图 G = (VY, EE) 的 深度 优先 搜索 将 E 中 的 边 划 分 为 两 个 集合 7 和 8B。 当 处 于 顶点 v 考虑 边 
(v，w) 时 ， 如 果 顶 点 ww 之 前 尚未 访问 ， 则 边 (v,w) 放 人 集合 7 中 。 否 则 ， 边 (v，w) 放 入 集合 B 
中 。 集 合 了 中 的 边 称 为 树 边 (tree edges), m B PIE AL ERO m e) id (back edges) 。 子 图 (了 Y，7) 为 
一 个 无 向 森林 ， 称 为 G 的 深度 优先 生成 森林 。 在 此 情况 下 ， 森 林 包 含 一 棵 树 ( 了 ，7) ， 称 为 深度 
优先 生成 树 。 注意 ， 如 果 OC 是 连通 的 ， 深 度 优 先生 成 森林 将 是 一 棵 树 。 该 深度 优先 生成 森林 中 
的 每 棵 树 将 认为 是 有 根 的 ， 树 的 深度 优先 搜索 开始 于 根 所 在 的 顶点 。 





下 面 给 出 图 的 深度 优先 搜索 算法 。 
算法 5. 2 无 向 图 的 深度 优先 搜索 。 
RA: 图 G=(V,，E)， 由 邻接 表 L[v] 表 示 ， 其 中 procedure SEARCH(y): 
veV; . mark v “old”; 
: ü . for each vertex w on L[v] d 
pe RE: HARA TAHAA cach vertex w on L[v] do 
方法 : 在 通过 起 始 于 » 的 一 条 边 进行 搜索 期 间 ， 如 ”| 4 add (v, w) to T; 


SEARCH(w) 


果 最 先 到 达 顶 点 w， 则 图 5-6 中 的 递归 程序 SEARCH(>) 
将 边 ("，zw) 加 入 集合 7。 假定 所 有 的 项 点 初始 时 都 标记 
Fa" Bh” (new) 。 整 个 算法 如 下 : 





图 5-6 深度 优先 搜索 
6 T — 8. 
7 for all v in V do mark v “new”; 
8. while there exists a vertex v in V marked "new" do 
9 SEARCH(v) ` 


end 


所 有 在 E 中 但 不 在 7 中 的 边 都 认为 位 于 8 中 。 注 意 ， 如 果 边 (v,w) 位 于 EE 中 ， 则 ww 将 处 于 
L[v] 中 ,县 v 将 位 于 LLw] 中 。 因 此 ， 如 果 当 前 位 于 顶点 v， 且 由 于 顶点 w 可 能 为 "的 父亲 而 标记 
为 “ 提 ”(old)， 则 不 能 够 简单 地 将 边 (v,w) 置 于 8 中 。 口 

例 5.2 为 了 方便 , 将 7 中 的 树 边 用 实 线 表示 ， 而 将 B 中 的 回 向 边 用 虚线 表示 。 并 且 ， 树 
(或 多 棵 树 ) 的 根 (在 第 8 行 选 定 的 起 始 项 点 ) 将 位 于 顶部 。 从 左 到 右 ， 按 对 应 的 边 在 SEARCH 第 
4 行 中 添加 的 顺序 ， 画 出 每 个 顶点 的 儿子 。 考 虑 图 5-7a， 该 图 一 个 可 能 的 树 边 和 回 向 边 的 划分 导 
致 了 图 $-7b 所 示 的 深度 优先 搜索 。 





图 5-7 图 及 其 深度 优先 生成 树 
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初始 时 ， 所 有 顶点 都 是 “新 ”。 假 定 在 第 8 行 中 选 定 w 。 当 执行 SEARCH(w ) ， 可 以 在 第 2 行 
选择 w = 图。 由 于 风 标 记 为 “新 ”， 将 (ww ， o) ALT, DARA SEARCH(»,), SEARCH(»,) 可 以 从 
Lin JHAR o, Ao, 已 经 标记 为 “ 旧 ”。 假 定 选 定 w-v,, AAR”, EC, v) 添加 到 
T, WR] SEARCH(w ) 。 与 性 邻接 的 每 个 顶点 现在 都 是 “ 旧 ”， 因 此 返回 到 SEARCH (v, ) 。 

然后 ， 继 续 SEARCH(w ) ， 找 到 边 (，w ) ， 将 其 加 入 7， 并 调用 SEARCH(w ) 。 注 意 ， 在 图 5- 
7b 中 ，%% 位 于 之 前 发 现 的 5 的 儿子 w 的 右边 。 没 有 “新 ”顶点 与 邻接 ， 因 此 返回 SEARCH(v,)。 此 
Bf, 设 找到 “新 ”顶点 同 v, 邻接 ， 因 此 返回 SEARCH (w )。 继 续 SEARCH (v,), 找到 wv,， 且 由 
SEARCH (», ) 找 到 wv。 那么 ， 所 有 项 点 将 位 于 树 中 并 标记 为 “ 旧 ”， 因 此 算法 终止 。 如 果 图 不 是 连通 
的 , 第 8 ~9 行 中 的 循环 将 继续 ， 对 于 每 个 分 支 重复 一 次 。 口 

定理 5.2 对 于 有 nn 个 顶点 e 条 边 的 图 ， 算 法 5.2 需要 O(MAX(nm，e) ) 步 。 

证 明 ; 如 果 生 成 一 个 顶点 列表 并 扫描 一 次 ， 则 第 7 行 以 及 第 8 行 中 对 “新 ”顶点 的 搜索 需要 
0(n) 步 。 除 了 对 本 身 的 递归 调用 ， 在 SEARCH(v) 中 花费 的 时 间 同 v 所 邻接 的 顶点 数 成 比例 。 由 
于 在 SEARCH(v) 第 一 次 调用 的 时 候 ，*” 标记 为 “ 旧 ”， 所 以 ,对 于 给 定 的 v, TEMICHCO GUA 
一 次 。 因 此 ， SEARCH 所 花费 的 总 时 间 为 0( MAX(n，e))， 从 而 定理 得 证 。 

深度 优先 搜索 的 部 分 能 力 包 含 在 下 列 引 理 中 ， CoE LAM C 的 每 条 过 不 是 深度 优先 森林 中 
的 一 条 边 ， 就 是 在 深度 优先 生成 森林 中 的 某 棵 树 中 连接 祖先 及 其 后 代 。 因 此 ， 无 论 是 树 边 还 是 回 
向 边 ，C 中 所 有 的 边 连接 两 个 顶点 ， 使 得 在 生成 森林 中 一 个 顶点 是 另 一 个 顶点 的 祖先 。 

引 理 5.3 WRO, ww) 为 一 条 回 向 边 ， 则 在 生成 森林 中 ,v2 为 w 的 祖先 或 w 为 的 祖先 。 

证 明 : PRR, BEENI w 之 前 访问 v， 在 此 意义 上 ，SEARCH(wv) 在 SEARCH(w) 之 
前 调用 。 因 此 ， 当 到 达 "的 时 候 ，zw 仍 标记 为 “新 ”。 在 生成 森林 中 ， 通 过 SEARCH (») WAT 
有 “新 ”顶点 将 成 为 v 的 后 代 。 但 是 ， 由 于 w 处 于 列表 L[v] 中 ，SEARCH (vw) 不 可 能 终止 直到 到 
达 w。 口 

存在 一 个 自然 序 ， 将 深度 优先 搜索 施加 到 生成 森林 的 顶点 。 换 名 话说， 如 果 在 算法 5. 2 的 第 
6 和 7 行 之 间 将 COUNT 初始 化 为 1， 并 在 SEARCH 程序 的 开始 处 插 人 如 下 语句 ， 则 可 以 按 其 访问 
的 顺序 标记 顶点 : 

DFNUMBER[ v] —COUNT; 
COUNT-—COUNT +1; 

然后 ， 森 林 中 的 顶点 将 标记 为 1，2，…， 一 直到 森林 中 的 顶点 数 。 

对 于 nn 个 顶点 的 图 ， 可 以 在 0(n) 时 间 内 完全 地 安排 这 些 标记 。 在 最 终 得 到 的 生成 森林 中 ， 
标记 的 顺序 同 每 棵 树 的 前 序 遍 历 相 一 致 。 而 后 将 假定 ， 所 有 深度 优先 生成 森林 也 是 按 此 方式 标 
记 。 通 常 ， 即 使 其 本 身 就 是 顶点 的 名 字 ， 也 将 处 理 这 些 顶 点 标记 。 因 此 ， 这 使 某 些 说 法 有 意义 ， 
m, “vcw”, Kp o Mw NMA. 

例 5.3 图 5-7a 中 顶点 的 深度 优先 序 为 vz ，v,, 5, %, v, 4, AANA É LER 
SEARCH 初始 化 的 顺序 来 保证 这 种 优先 序 ， 或 通过 先 序 方式 遍历 图 5-7b 中 的 树 来 确定 。 口 

GRIER, WR hwo 的 合适 的 祖先 ， 则 有 wv <w。 另 外 ， 在 一 棵 树 中 如 果 v 在 w 的 左边 ， 


则 vw<w。 
5.3 双 连 通 性 


现在 考虑 应 用 深度 优先 搜索 来 确定 无 向 图 的 双 连 通 分 支 。 设 C = (V, 五) 为 连通 无 向 图 。 如 
果 存 在 顶点 v 和 w， 使 v 和 w 之 间 的 每 条 路 径 都 包含 相 异 于 v、w 的 顶点 a， 则 顶点 a 称 为 C 的 关 
节点 (articulation point) 。 换 句 话说 ， 若 删除 a 将 把 C 分 解 为 两 个 或 更 多 的 部 分 ， 则 c 为 6 的 一 个 
关节 点 。 如 果 对 于 相 异 的 3 个 顶点 v、w 和 a， Ev Aw 之 间 存 在 一 条 不 包含 a 的 路 径 ， 则 称 图 C 
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是 双 连 通 的 。 因 此 ， 一 个 无 向 连通 图 为 双 连 通 的 ， 当 且 仅 当 其 无 关节 点 。 

如 果 两 条 边 e =e, 或 者 存在 含有 e 和 e, 的 环 ， 则 称 边 e M e: 关 联 ， 此 时 能 够 在 C 的 边 集合 上 

ane 容易 证 明 ， 该 关系 为 一 个 等 价 关系 ?， 它 将 C 的 边 划 分 为 等 价 类 E, 
SE, WE: 两 条 不 同 的 边 处 于 同一 类 中 ， 当 且 仅 当 它们 处 在 一 个 公共 环 中 。 对 于 Isis 
k VAART Ech YA, 称 每 个 图 G,=(V,, E) CRIED E. 

例 5.4 考虑 图 S-8a 中 的 无 向 图 。 例 
W, HF o 和 四 之 间 的 每 条 路 径 都 经 由 
v, MAHA v4 为 一 个 关节 点 。 公 共 环 上 
的 等 价 类 为 

LG, n), (%, Vs), (v,, v), 

lO, v9, (S, v), (%, v5)}, 

{ Co, v). 

ls, D), (be, %), (ve, v), 
(5, 9), (ve, %) to 

这 些 集合 引出 了 图 5-8b 所 示 的 双 连 
通 分 支 。 唯 一 的 非 直观 处 是 边 (w%，w ) 本 
身 是 等 价 类 (不 存在 包含 这 条 边 的 环 ) ， 其 a) 无 向 图 b) 无 向 图 的 双 连 通 分 支 
所 在 的 “ 双 连 通 分 支 " 仅 包含 顶点 w 和 ww。 





图 5-8 


口 

下 述 引 理 给 出 一 些 与 双 连 通 性 相关 的 有 用 信息 。 

引 理 5.4 XPPlIsixk, X G,=(V,，E,) 为 连通 无 向 图 G=(V, E) 的 双 连 通 分 支 ， 那 么 ， 

l. HFEA i(1«isk), ，C 是 双 连 通 的 。 

2. 对 于 所 有 的 izj，V,NV 至 多 包含 一 个 顶点 。 

3.a 为 6G 的 一 个 关节 点 ， 当 且 仅 当 对 于 某 izj， 有 a eVNV。 

GER 

l. 假定 7 中 存在 3 个 相 异 的 顶点 v、w Alo, HC PRA Aw 之 间 的 路 径 都 经 由 ac， 那么 ， 
肯定 (vw, w) 不 是 E. 中 的 一 条 边 。 因 此 ，E, 中 存在 不 同 的 边 (v,v') 和 (w，w') ， 并 且 在 C PRE 
这 些 边 的 环 。 由 双 连 通 分 支 的 定义 ,该 环 的 所 有 边 和 顶点 都 分 别 位 于 ED 和 VY 中。 因此 , TE GP v 
和 ww 之 间 存 在 两 条 路 径 ， 仅 有 一 条 包含 a， 矛盾 。 

2. 假定 两 个 相 异 顶点 v 和 w 处 于 VNV 中 。 那 么 , 在 6, 中 存在 一 个 包含 w 和 2 WHC, E 
6 中 也 存在 一 个 包含 和 w 的 环 C,。 由 于 EE 和 不 相交 ， 所 以 ， 在 C, 和 C: 中 的 边 集 是 不 相交 的 。 
然而 ， 可 以 通过 使 用 C, 和 C, 中 的 边 构 造 一 个 包含 v 和 w 的 环 ， 意 味 着 在 已 中 至 少 有 一 条 边 等 价 
于 忆 中 的 一 条 边 。 因 此 ， 按 照 假定 的 条 件 ， 将 使 得 E, 和 不 是 等 价 类 。 

3. 假定 顶点 a 是 G 的 关节 点 ， 则 存在 两 个 顶点 » 和 w， 满足 sv、w 和 a AR, Bow 之 间 
的 每 条 路 径 都 包含 a。 由 于 6 是 连通 的 ， 至 少 存在 一 条 这 样 的 路 径 。 设 (*，a) 和 (y，a) 为 和 zw 
之 间 一 条 与 a 关联 的 路 径 上 的 两 条 边 。 如 果 存 在 一 个 环 含有 这 两 条 边 ， 那 么 vz 和 w 之 间 存 在 一 条 
不 包含 a 的 路 径 。 因 此 ，(x，a) 和 (y，a) 处 于 不 同 的 双 连 通 分 支 中 ， 且 a 为 它们 顶点 集合 的 交 。 
相反 ， 如 果 ae VNV， 则 在 E 和 互 中 分 别 存在 边 (x，a) 和 (y，a)。 由 于 这 两 条 边 都 没有 出 





如 果 尺 是 自 反 的 (对 于 所 有 的 aeS，aRa)、 对 称 的 (对 于 所 有 的 a、5 e S$，aRb RAE bRa) 和 传递 的 (aRb 和 
bRc 蕴涵 着 aRc) ， 则 R 为 集合 S 的 等 价 关系 。 容 易 证 明 ，5 的 等 价 关系 将 S 划分 为 不 相交 的 等 价 类 。( 子 集 [ a] 
= |51 bRa| 称 为 等 价 类 。) 
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现在 任意 一 个 环 ， 满 足 从 * By HERRERA a Alt, a 是 一 个 关节 点 。 口 

在 寻找 无 向 图 的 双 连 通 分 支 时 ， 深 度 优先 搜索 特别 有 用 。 原 因 之 一 在 于 ， 由 引 理 5.3, ARTE 
在 “交叉 边 ” 。 也 就 是 说 ， 在 生成 森林 中 ， 如 果 顶 点 " 既 不 是 w 的 祖先 ， 也 不 是 其 后 代 ， 那 么 可 
能 不 存在 从 v B) w 的 边 。 

如 果 顶 点 a 为 关节 点 ， 那 么 删除 a 及 与 a 相关 的 所 有 边 后 ， 图 将 分 解 为 两 个 或 更 多 的 部 分 。 
其 中 一 部 分 由 a 的 儿子 s 及 其 在 深度 优先 生成 树 中 的 所 有 后 代 组 成 。 因 此 ， 在 深度 优先 生成 树 
H, a 必定 有 一 个 儿子 s， 在 * 的 后 代 和 a 的 某 个 祖先 之 间 不 存在 回 向 边 。 反 之 ， 除 了 生成 树 的 
根 ， 如 果 不 存在 从 a 的 任意 儿子 的 后 代 到 a 的 某 个 祖先 的 回 向 边 ， 则 没有 交叉 边 意味 着 项 点 a 为 
一 个 关节 点 。 深 度 优 先生 成 树 的 根 是 一 个 关节 点 ， 当 且 仅 当 它 有 两 个 或 多 个 儿子 。 

例 5.5 图 5-8a 中 的 图 对 应 的 深度 优先 生成 树 如 图 5-9 BAR. UPON v. Aloe. MA v, 
有 儿子 w， 并 且 从 全 的 后 代 到 的 祖先 之 间 不 存在 回 向 边 。 同 样 ， 有 儿子 w，w 有 儿子 ww， 都 
具有 相似 的 属性 。 口 

先前 的 思想 体现 在 下 列 引 理 中 。 

引 理 5.5 设 C=(Y， 有 ) 为 连通 无 向 图 ， 并 设 S = (V, T) 为 6 的 深度 优先 生成 树 。 顶 点 a 
为 6 的 一 个 关节 点 ， 当 且 仅 当 

l.a HR, WH a 有 超过 一 个 儿子 ， 或 者 

2.a 不 是 根 ， 并 且 对 于 a 的 某 个 儿子 *， Es 的 任意 后 代 ( 包 括 其 本 身 ) 和 a 的 某 个 祖先 之 间 
不 存在 回 向 边 。 

证 明 : 容易 证 明 ， 根 为 关节 点 当 且 仅 当 其 有 多 于 一 个 儿子 。 此 部 分 留 作 练习 。 

假定 条 件 2 是 成 立 的 。 设 f 为 a 的 父亲 。 由 引 理 5. 3， 每 条 回 向 边 都 是 从 一 个 顶点 到 其 祖先 。 
因此 ，* 的 后 代 w 的 任意 回 向 边 指 向 v 的 祖先 。 由 引 理 的 假设 ， 回 向 边 不 能 到 达 a 的 某 个 祖先 。 因 
此 ,要么 指向 a, ATIS S Ha. Bit, Ms 到 f 的 每 条 路 径 都 包含 a， 意味 着 a 为 一 个 关节 点 。 

ARE, 假定 a 为 一 个 关节 点 但 不 是 根 。 设 x 和 y 为 相 异 于 a 的 顶点 ， 满 足 在 C 中 每 条 
* 和 y 之 间 的 边 都 包含 a。x My 中 至 少 有 一 个 假设 为 <， 是 5 中 a 的 某 个 后 代 ， BW, 在 C 中 > 
和 y 之 间 存 在 一 条 路 径 使 用 了 T 中 的 边 但 不 包含 a。 设 :为 a 的 儿子 , 使 得 x 为 :的 后 代 ( 可 能 x = 
s)。 或 者 在 s 的 后 代 v 和 a 的 某 个 祖先 w 之 间 不 存在 回 向 边 ， 这 直接 使 得 条 件 2 的 情形 是 正确 的 ， 
或 者 存在 这 样 的 一 条 边 (*，w ) 。 在 后 一 种 情况 下 ， 必 须 考虑 两 种 情形 。 





图 5-9 深度 优先 生成 树 图 5-10 路径 反 例 


情形 1 假定 y 不 是 a 的 后 代 。 那 么 ， 存 在 一 条 从 x 到 v， 再 到 w， 再 到 y 的 路 径 ， 避 开 了 a, 
矛盾 。 见 图 5-10a。 


情形 2 假定 y 为 a 的 后 代 。 肯 定 y 不 是 :的 后 代 ， 否则 存在 从 x By 的 一 条 路 径 ， 避 开 a 
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设 * 为 的 儿子 ， 使 得 y 为 ?的 后 代 。 在 * 的 后 代 w 和 a 的 某 个 祖先 w' 之 间 不 存在 回 向 边 ， 在 此 
情形 ， 条 件 2 直接 成 立 ， 或 者 存在 这 样 的 一 条 边 (v'，w’') 。 在 后 一 种 情况 下 ， 存 在 从 x 到 v， 再 
到 w， Alw, HAv, EA y 的 一 条 路 径 ， 避 开 a, 矛盾 。 见 图 5-10b。 至 此 得 到 结论 ， am 
是 正确 的 。 
对 连通 无 向 图 C= (了 ,五 ) 施 行 深度 优先 搜索 ， BIRD Bebe tue EROR S 
RE. [BOE V 中 的 顶点 以 它们 的 深度 优先 搜索 数 命名 。 对 于 V 中 的 每 个 v， 定 义 
LOW[v] =MIN( {v} U {wl 存在 回 向 边 (x，w) e B， 使 得 
在 深度 优先 生成 森林 (V，7) 中 ， 
x 为 "的 后 代 ， 且 2 Ao 的 祖先 1 ) (5-1) 
先 序 编号 意味 着 ， 如 果 % 为 的 后 代 且 (x*，w) 为 回 向 边 使 得 w <v， 那么 w 为 v 的 某 个 祖先 。 
因此 ， 由 引 理 5.5， 如 果 顶 点 vb 不 为 根 ， 那 么 v 为 关节 点 当日 仅 当 vb 有 儿子 ;使 得 LOW[ s] zv 
如 果 根 据 经 由 回 向 边 邻 接 到 v 的 顶点 和 vw 的 儿子 的 LOW 值 ， 重 写 式 (5-1) 以 表达 LOW[wv]， 
则 可 以 在 程序 SEARCH 中 嵌入 一 个 计算 步 确定 每 个 顶点 的 LOW 值 。 特 别 地 ， 要 计算 LOW], 
可 以 通过 确定 顶点 w 的 最 小 值 ， 使 得 
1.w=v, 或 者 
2.w=LOW[s] 且 ;为 v 的 儿子 , 或 者 
3. (v, 名) 为 B 中 的 回 向 边 。 
只 要 穷 举 与 v 邻接 的 列表 ZL[v] 的 值 ， 就 可 以 确定 w 的 最 小 值 。 因 此 式 (5-1) 等 价 于 
LOW[»] =MIN( {v} U {LOW[s] ls 为 "的 儿子 | Ulw! (v, w) eB}) (5-2) 
至 此 ， 已 经 按 优先 访问 对 顶点 进行 重 命名 并 计算 LOW， 并 将 其 加 入 到 图 5-11 所 示 SEARCH 
的 修改 版 中 。 在 第 4 行 ， 将 LOW[v] 初 始 化 为 其 最 大 可 能 值 。 如 果 在 深度 优先 生成 森林 中 ， 顶 点 
v 有 儿子 w， 要 是 LOW[w] 小 于 LOW[zv] 的 当前 值 ， 则 在 第 11 行 调整 LOW[v] 。 如 果 通 过 一 条 回 
向 边 将 顶点 v 连接 到 顶点 w， 要 是 顶点 w 的 深度 优先 数 小 于 LOW[5] 的 当前 值 ， 则 在 第 13 行使 
LOW[v»]2y DFNUMBER[w]。 由 于 在 深度 优先 生成 树 中 ，w 是， 的 父亲 ， 所 以 在 第 12 行 中 的 判定 
验证 了 (v,w) 并 非 真 正 的 回 向 边 。 因 此 ， 图 5-11 实现 了 方程 (5-2)。 


procedure SEARCHB(v): 
begin 


mark v “old”; 
DFNUMBER[»] « COUNT; 
COUNT — COUNT + 1; 
LOW[v] ~ DFNUMBER[v); 
for each vertex w on L[v) do 
if w is marked "new" then 


add (v, w) to T; 

FATHER[w] + v; 

SEARCHB(w); 

if LOW[w] > DFNUMBER[v] then a biconnected 
component has been found; 

LOW[v) — MIN(LOW[»), LOW[w]) 


end 
else if w is not FATHER[v] then 
LOW[v] <— MIN(LOW[v], DFNUMBER(w]) 








图 5-11 包含 计算 LOW 值 的 深度 优先 搜索 


由 于 已 经 为 每 一 个 顶点 2 找到 了 LOW[v] ， 可 以 很 容易 地 识别 出 关节 点 。 下 面 首先 给 出 完整 
的 算法 ， 然 后 证 明 其 正确 性 ， 再 说 明 其 时 间 开 销 为 0(e)。 
算法 5.3 找 出 双 连 通 分 支 。 


MENDES e 


^ -- d a Aa 4 AÀ o m 0 
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输入 : 连通 无 向 图 C= (V, E), 

输出 : C 的 每 个 双 连 通 分 支 的 边 列 表 。 

方法 ; 

1. 初始 时 ,将 了 设置 为 乡 ，COUNT 设 为 1。 并 将 了 中 的 每 个 顶点 标记 为 “新 "”。 然 后 选择 了 
中 的 任意 顶点 v, WA SEARCHB(»,) (图 5-11) ， 构 建 一 棵 深度 优先 生成 树 $= (Y，7) ， 为 了 中 
的 每 个 "计算 LOW(v)。 

2. 当 在 SEARCHB 的 第 5 行 碰 到 顶点 w 时 ， 要 是 边 (*，zw ) 不 在 边 的 下 推 存储 STACK 中 ， 则 
将 其 放 入 STACK H°, ER 10 行 找到 (v, w) 使 得 ww 为 v 的 儿子 且 LOW[w] >v 后 ， 从 STACK 中 
弹出 所 有 的 边 直 到 含有 (vw，w) 。 这 些 边 组 成 了 C 的 双 连 通 分 支 。 口 


LOW [1] =1 
LOW [2] =1 
LOW [3] = 2 


LOW [4] = 4 






LOW [5] =4 | 
\ 


LOW [6] = 4 





N 


(7) Low {7} =4 


图 5-12 考虑 LOW 值 的 图 5-9 的 生成 树 


例 5.6 重新 生成 图 5-9 的 深度 优先 生成 树 如 图 5-12 所 示 ， 顶 点 由 DFNUMBER 重 命名 ， 且 
显示 LOW 值 。 例 如 ， 由 于 存在 回 向 边 (6， 4) ，SEARCHB(6) 确 定 LOW[6] =4。 然 后 ， 由 于 4 小 
于 LOW[5] 的 初始 值 5， 通 过 调用 SEARCHB(6), SEARCHB(5) 3t LOW[5] =4。 

在 完成 SEARCHB(5) 之 后 ， 发 现 (第 10 行 )LOW[5] =4。 因 此 ,4 为 关节 点 。 此 处 ， 下 推 式 
存储 包含 边 ( 从 底 至 顶 ) : 

(1, 2), (2, 3), (3, 4), (4, 5, (5, 6), (6, 4), (5, 7), (7, 4) 

因此 , 往 下 弹出 边 以 包含 (4，5)， 也 就 是 说 ， 输 出 边 (7, 4). (5, 7). (6, 4), (5, OM 
(4, S) 为 找到 的 第 一 个 双 连 通 分 支 的 边 。 

观察 SEARCHB(2) 完 成 的 工作 ， 可 以 发 现 LOW[2] =1， 并 且 即 使 1 不 是 关节 点 也 会 清空 下 
推 式 存储 。 这 确保 包含 根 的 双 连 通 分 支 也 可 弹出 。 口 

定理 5.3 算法 5.3 正确 地 找到 C 的 双 连 通 分 支 ， 如 果 C 有 e 条 边 则 需要 O(e) 时间。 

EA: 步骤 1 需要 0(e) 时 间 的 证 明 是 对 SEARCH( 定 理 5.2) 观察 的 一 个 简单 扩展 。 步 又 2 
对 每 条 边 验 证 一 次 ,将 其 放 入 一 个 下 推 式 存储 ， 而 后 弹出 它 。 因 此 步骤 2 是 0(e) 的 。 

对 于 算法 的 正确 性 ， 引 理 5.5 确保 正确 地 找到 关节 点 。 即 使 根 不 是 一 个 关节 点 ， 但 为 了 弹出 
包含 根 的 双 连 通 分 支 ， 它 也 被 认为 是 关节 点 。 

必须 证 明 ， 如 果 LOW[v]>*， 那 么 当 完 成 SEARCHB(w) 时 ，STACK (v, w) 以 上 的 边 将 


O 注意， 如 果 (v，w) 为 一 条 边 ,，v 处 于 LEw] 中 ,，w 处 于 L[v] 中 ,那么 (v，w) 要 碰 到 两 次 ， 一 次 是 顶点 ov 访问 ， 
一 次 是 顶点 ww 访问。 通过 测试 ， 如 果 v<w Bw WI", 或 者 >w H w =FATHER[v] ， 可 以 验证 是 否 (v，w) 
已 经 位 于 STACK 中 。 
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恰好 是 在 含有 (v，w) 的 双 连 通 分 支 中 的 那些 边 。 这 可 以 通过 基于 6 的 双 连 通 分 支 数 5 的 归纳 来 
做 到 。 对 于 归纳 的 基 5b =1， 显 然 成 立 ， 因 为 在 这 种 情况 下 ，* 为 树 的 根 ，(v，w) 为 以 sv 为 起 点 的 
唯一 树 边 ， 并 且 当 SEARCHB(w) SERI, G 中 所 有 的 边 都 在 STACK H, 

现在 ,假定 归纳 假设 对 所 有 包含 6 个 双 连 通 分 支 的 图 成 立 ， 并 设 6 为 具有 b+1 个 双 连 通 分 
HR. HFR, w), t SEARCHB(w) 为 SEARCHB 的 第 一 次 调用 ， 以 LOW(w) zv 结束 。 
由 于 没有 从 STACK 中 删除 任何 边 ， 在 STACK 中 位 于 (v,w) 之 上 的 边 的 集合 为 所 有 以 w 的 后 代为 
起 点 的 边 的 集合 。 容 易 证 明 ， 这 些 边 恰好 是 含有 (v，w) 的 双 连 通 分 支 中 的 那些 边 。 当 从 STACK 
中 删除 这 些 边 的 时 候 ， 算 法 的 执行 如 在 图 6' 时 一 样 ， 图 6' 由 6 通过 删除 含有 边 (v，w) 的 双 连 通 
分 支 而 得 到 。 现 在 ， 可 适用 归纳 步 ， 因 为 C 有 4 个 双 连 通 分 支 。 o 


5.4 有 向 图 的 深度 优先 搜索 


TURA 5; v dH" 邻接 "的 顶点 列表 L[ v] E SC wl (v, zw) 为 一 条 边 | ， 即 LLvj] 为 以 5 为 尾 的 
边 头顶 点 的 列表 ， 那 么 能 够 用 算法 5.2 为 有 向 图 C = (V,，E) 寻 找 有 向 生成 森林 。 





b) 生成 森林 


5-13. 有 向 图 的 深度 优先 搜索 


例 5.7 图 5-13a 给 出 一 个 有 向 图 ， 在 图 5-13b 是 它 的 深度 优先 生成 森林 。 同 先前 一 样 ， 树 
边 用 实 线 表示 ， 其 他 边 用 虚线 表示 。 

为 构造 生成 森林 ， 从 v, 开始 。SEARCH (v, ) 调用 SEARCH (v;), SEARCH ( v, ) 调用 
SEARCH(v,) 。 当 不 能 继续 添加 到 树 时 ， 较 后 的 过 程 终 止 。 因 为 以 为 尾 端的 叭 一边 指向 Ti», 
BARRAR”. AE, RER) SEARCH(w,) ， 添 加 v4 为 v, 的 第 二 个 儿子 。SEARCH (v) 终止 ， 
因为 vw, 已 经 是 “ 旧 的 ”"”， 所 以 对 森林 不 做 添加 。 然 后 ，SEARCH(w, ) 终 止 ， 因 为 除了 5 外 ,已 经 考 
FET SAH. FEB w ， 调 用 SEARCH (ws)。 后 者 也 以 对 树 无 添加 操作 而 终止 ,相似 地 ， 
SEARCH (v, ) 也 不 再 进行 任何 添加 。 

现在 ， 选 择 作为 新 深度 优先 生成 树 的 根 。 其 结构 与 前 述 相似 ， 留 给 读者 证 明 。 注 意 ， 选 
择 访 问 顶 点 的 顺序 是 ，v,，…，vs。 因 此 ， 顶 点» 的 深度 优先 编号 为 i，1 <i<8。 口 

注意 ， 在 有 向 图 的 深度 优先 搜索 中 ， 除 了 树 边 还 存在 3 种 类 型 的 边 。 如 图 5-13b 中 诸如 (w， 
v, ) 的 回 向 边 ，(w% ，u% ) 的 从 右 到 左 交 叉 边 以 及 (wm v.) 的 前 向 边 。 然 而 ， 没 有 任何 边 以 较 低 深度 优 
先 编号 的 顶点 为 起 点 ， 而 指向 深度 优先 编号 更 高 的 顶点 ， 除 非 后 者 是 前 者 的 后 代 。 这 并 非 偶然 。 

这 种 解释 同 在 无 向 图 中 不 存在 交叉 边 的 理由 是 相似 的 。 假 定 (v, w) 是 一 条 边 , v 在 w 之 前 被 
访问 (也 就 是 oz<w)。 在 SEARCH(w) 开 始 到 终止 的 那 段 时 间 ， 给 每 个 顶点 安排 一 个 编号 ， 成 为 vo 
的 后 代 。 但 是 ， 必 须 在 边 (v，w) 出 现时 给 w 安排 一 个 编号 ， 除 非 已 经 给 w 安排 了 编号 。 如 果 在 
边 (vw，w) 出 现时 给 ww 安排 一 个 编号 ， 则 (v，w) 成 为 一 条 树 边 。 否 则 ，(v，w) 为 一 条 前 向 边 。 因 
此 可 能 不 存在 使 v<w 的 交叉 边 (v，w)。 
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EAR ACH, G 的 深度 优先 搜索 将 边 划 分 为 4 类 : 

1. 树 边 ， 在 搜索 期 间 导 向 新 顶点 的 边 ; 

2. 前 向 边 ,， 源 自 祖先 ， 并 指向 某 个 后 代 ， 但 不 是 树 边 ; 

3. 回 向 边 ， 源 自 后 代 而 指向 祖先 (可 能 由 一 个 顶点 到 其 本 身 ) ; 

4. 交叉 边 , 在 彼此 不 互 为 祖先 或 者 后 代 的 顶点 之 间 的 边 。 

下 面 的 引 理 说 明了 交叉 边 的 关键 属性 。 

引 理 5. 6 如 果 (v，w) 为 交叉 边 ， 则 wv>w， 也 就 是 说 ， 交 叉 边 从 右 到 左 。 

证 明 : 证 明 类 似 于 引 理 5.3， 留 给 读者 作为 练习 。 口 


5.5 ” 强 连通 性 


对 有 向 图 进行 深度 优先 搜索 可 使 一 些 有 效 算法 的 设计 成 为 可 能 ， 作 为 例子 ， 考 虑 判定 一 个 
有 向 图 是 否 强 连通 的 问题 ， 即 从 每 个 顶点 到 任意 其 他 顶点 是 否 存在 一 条 路 径 。 

定义 设 G=(V, EF) 为 有 向 图 。 可 以 将 V 划 分 为 等 价 类 V1<i<r, 使 顶点 ov 和 w 等 价 ， 
当 且 仅 当 存 在 一 条 从 ov 到 ww 的 路 径 以 及 一 条 从 w 到 4v 的 路 径 。 设 (1<igr) 为 连接 VV 中 顶点 对 
的 边 的 集合 。 图 C; = (V,，E,) 称 为 G 的 强 连通 分 支 。 即 使 G 中 的 每 个 顶点 位 于 某 个 VV 中 ，G 也 可 
以 有 不 在 ,中 的 边 。 一 个 图 认为 是 强 连 通 的 ， 如 果 它 仅 有 一 个 强 连 通 分 支 。 

现在 利用 深度 优先 搜索 找 出 图 的 强 连 通 分 支 。 首 先 证 明 每 个 强 连通 分 支 的 顶点 都 是 由 深度 
优先 搜索 而 确定 的 生成 森林 的 一 个 连通 子 图 。 该 连通 子 图 为 一 棵 树 ， 且 树 的 根 称 为 强 连通 分 支 
的 根 。 然 而 ， 并 非 深度 优先 生成 森林 中 的 每 棵 树 都 必须 表示 一 个 强 连通 分 支 。 

引 理 5.7 设 6,=(V,,E,) 为 有 向 图 G 的 强 连 通 分 支 。 设 $=(V, 7 了) 为 G 的 深度 优先 生成 森 
林 。 那 么 ，G 的 顶点 连同 ,和 了 公共 的 边 一 起 形成 一 棵 树 。 

证 明 : 设 v 和 w 为 V. 中 的 顶点 (假定 用 深度 优先 编号 命名 顶点 ) 。 不 失 一 般 性 ， 假 定 v < w。 
由 于 ”和 位 于 相同 的 强 连 通 分 支 中 ， 在 6G, 中 存在 一 条 从 v 到 w 的 路 径 P。 设 x 为 P 中 最 小 编号 
的 顶点 (可 能 是 v 本 身 )。 一 旦 路 径 P 到 达 z 的 一 个 后 代 ， 就 不 可 能 离开 x 后 代 所 在 的 子 树 ， 因 为 
唯一 能 够 离开 子 树 的 边 是 指向 编号 小 于 * 的 顶点 的 交叉 边 和 回 向 边 。( 因 为 从 * 开始 ，x 的 后 代 
连续 编号 。 离 开 x 后 代 的 子 树 的 交叉 边 或 回 向 边 必须 指向 编号 小 于 x 的 顶点 。) 因 此 ，w 为 x 的 后 
代 。 由 于 顶点 按 先 序 编号 ， 所 有 编号 在 x 和 w 之 间 的 顶点 也 是 x 的 后 代 。 由 于 x<v<w, ov 为 x 的 
后 代 。 

至 此 ， 已 经 证 明 G; 中 的 任意 两 个 顶点 在 G, 中 有 相同 的 祖先 。 设 7 为 G. 中 顶点 的 最 小 编号 公 
FASE. WR EC, 那么 在 生成 树 中 从 > 到 "路 径 上 的 任意 顶点 也 位 于 GH O 

在 有 向 图 C 的 深度 优先 搜索 期 间 ， 通 过 按 根 最 后 被 碰 到 的 顺序 找 出 各 分 支 的 根 ， 可 以 找到 6 
的 强 连通 分 支 。 设 r, ，r,，… ,7 为 顶点 深度 优先 搜索 结束 时 按 序 排列 的 根 (也 就 是 7, 的 搜索 在 
ri 之 前 结束 )。 然 后 ， 对 于 每 个 i<j,r, 或 者 在 7 的 左边 ,或 者 + 为 深度 优先 生成 森林 中 ”的 
后 代 。 

设 6 为 强 连通 分 支 ， 其 根 为 r,， 其 中 1<isk。 那 么 ，G, 包 含 7 的 所 有 后 代 ， 由 于 对 于 j>1， 
7 不 可 能 为 r, 的 后 代 。 相 似 地 ， 可 以 证 明 下 述 引 理 。 

引 理 5.8 HFT Sisk), CHUA H WAEREA, BREG, G, =, Gao 

证 明 ; 对 于 j>i, 根 7 不 可 能 为 7, 的 后 代 ， 因 为 SEARCH (r) 的 调用 在 SEARCH (r) 之 后 
终止 。 口 
为 有 助 于 找到 根 ， 定 义 名 为 LOWLINK 的 函数 : 

LOWLINK[»] = MIN( iv] U jw | 存在 一 条 从 v 的 后 代 到 w 的 
交叉 边 或 回 向 边 ， 并 且 含有 zw 的 
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强 连通 分 支 的 根 为 o 的 祖先 | ) (5-3) 

图 5-14 给 出 了 一 条 从 v2 的 后 代 到 w 的 交叉 边 ， 其 中 ,含有 w 的 强 连 通 分 支 的 根 r 为 vz 的 
祖先 。 

很 快 将 看 到 执行 深度 优先 搜索 时 ， 如 何 计算 LOWLINK。 
首先 ， 根据 LOWLINK 提供 强 连 通 分 支 根 的 特点 。 

引 理 5.9 设 C 为 有 向 图 。 顶 点 "为 6 的 强 连通 分 支 的 
根 ， 当 且 仅 当 LOWLINK[»] =v. 

TER: 

“ 仅 当 ”。 假定 v C 的 强 连通 分 支 的 根 。 由 LOWLINK 
的 定义 ，LOWLINK[v] <v。 假 设 有 LOWLINK[v] <v。 那 么 ， 
存在 顶点 w 和 r， 使 得 

1. 通过 一 条 源 自 v 的 后 代 的 交叉 边 或 回 向 边 可 以 到 达 w, 

2.r 为 含有 w 的 强 连 通 分 支 的 根 ， 图 5-14 满足 LOWLINK 条 件 的 交叉 边 

3.r 为 "的 祖先 ， 并 且 

4. w «v, 

HAH 2, r 为 w 的 一 个 祖先 ， 因 此 r< 和 ww。 因此 ， 由 条 件 4，r<y， 根 据 条 件 3， 这 意味 着 
为 v 的 某 个 祖先 。 但是, r 和 vw 必须 位 于 相同 的 强 连通 分 支 中 ， 因 为 在 6 中 存在 一 条 从 > 到， 的 路 
径 和 一 条 从 "到 ~ 经 由 2 的 路 径 。 因 此 ,bo 不 是 强 连通 分 支 的 根 ， 矛 盾 。 所 以 ,可 以 得 出 结论 
LOWLINK[^»] =», f 

“ 当 "。 设 LOWLINK[ v] =v, WF v PESK v 的 强 连通 分 支 的 根 ， 那 么 w 的 某 个 后 代 r 为 
根 。 因 此 ， 存 在 一 条 从 v 到 7 的 路 径 P。 考 虑 尸 的 第 一 条 边 ， 从 * 的 后 代 到 顶点 w， 其 中 ww Ro 
的 后 代 。 这 条 边 要 么 是 指向 4 的 祖先 的 一 条 回 向 边 ， 要 么 是 指向 编号 小 于 4 的 顶点 的 一 条 交叉 
边 。 在 这 两 种 情况 下 ，w <v。 

还 需要 证 明 ，r 和 w 位 于 G 的 相同 强 连通 分 支 中 。 由 于 r 是 v 的 祖先 ， 必定 存 在 从 r 到 sv 的 一 
条 路 径 。 路 径 P 从 v 到 w， 再 到 +r。 因 此 , r 和 w 处 在 相同 的 强 连通 分 支 中 。 因 此 ，LOWLINK[»] 
<w<v, FH. oO 

在 深度 优先 搜索 期 间 ， 很 容易 计算 LOWLINK 的 值 。 也 可 以 按 下 列 方式 很 容易 地 找到 强 连通 
分 支 。 按 照 搜索 期 间 访问 到 的 顺序 ， 将 C 的 顶点 放 到 栈 中 。 无 论 何 时 找到 一 个 根 ， 相 关 强 连通 
分 支 的 所 有 顶点 都 位 于 栈 的 顶端 ， 并 且 被 弹出 。 这 种 策略 依据 引 理 5.8 和 深度 优先 编号 的 属性 
“实施 ”。 

第 一 次 到 达 顶 点 v 的 时 候 , 将 LOWLINK[v] 设 置 为 等 于 rv。 如 果 出 现 一 条 回 向 边 或 交叉 边 (v， 
w) ， 且 w 同 sv 的 某 个 祖先 位 于 相同 的 强 连通 分 支 当 中 ， 那 么 将 LOWLNK[v] 设 置 为 当前 值 和 w 
中 的 最 小 值 。 如 果 出 现 树 边 (v，w) ， 则 以 w 为 根 的 子 树 递归 出 现 ， 计 算 LOWLINK[w] 。 在 返回 ? 
Zia, 将 LOWLINK[v] 设 置 为 其 当前 值 和 LOWLINK[w] 中 的 最 小 值 。 

通过 检测 是 否 v 仍 处 于 顶点 栈 中 来 完成 检测 ， 以 确定 是 否 w 同 v 的 某 个 后 代位 于 相同 分 支 
中 。 利 用 一 个 数组 表明 是 否 顶 点 位 于 栈 中 来 实现 这 种 检测 。 注 意 ， 由 引 理 5.8， 如 果 w AE TR 
H, 那么 含有 w 的 强 连 通 分 支 的 根 为 v 的 祖先 。 

现在 修改 程序 SEARCH， 计 算 LOWLINK。 对 于 顶点 适用 一 个 下 推 列 表 STACK。 程 序 如 图 5- 
15 所 示 。 
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procedure SEARCHC(v): 
begin 


mark v “old”; 
DFNUMBER[v] € COUNT; 
COUNT — COUNT + 1; 
LOWLINK[v] — DFNUMBER([v]: 
push v on STACK; 
for each vertex w on L[v) do 

if w is marked "new" then 


SEARCHC(w); 

LOWLINK[v] — MINLOWLINK[], 
LOWLINK[w]) 

if DFNUMBER[w] < DFNUMBER[v)] and w is on 
K then 

LOWLINK[v] — MIN(DFNUMBER[»], 

LOWLINK[v]): 
f LOWLINK{v] = DFNUMBER[v] then 
begin 


repeat 


pop x from top of STACK; 
print x 


end 
unt x = v; 
print "end of strongly connected component" 
end 








55. 计算 LOWLINK 的 程序 


LOWLINK 的 计算 出 现在 第 4、9 和 11 行 。 在 第 4 行 ， 初 始 化 LOWLINK[v] 为 顶点 "的 深度 
优先 编号 。 在 第 9 行 ， 如 果 对 于 某 个 儿子 w，LOWLINK[w] 小 于 LOWLINK[v] 的 当前 值 ， 那 么 设 
置 LOWLINKLv] 为 LOWLINK[w]。 在 第 10 行 ,确定 (vs, w) 是 回 向 边 还 是 交叉 边 ， 并 检测 是 否 已 
经 找到 含有 w 的 强 连 通 分 支 。 如 果 没 有 ， 那 么 含有 w 的 强 连通 分 支 的 根 为 v 的 祖先 。 必 然 地 ， 在 
第 11 行 ， 如 果 已 经 不 存在 更 小 的 值 ， 则 将 LOWLINK[v] 设 置 为 w 的 深度 优先 编号 。 

下 面 给 出 为 有 向 图 找到 强 连通 分 支 的 完整 算法 。 

算法 5.4 有 向 图 的 强 连通 分 支 。 

A: 有 向 图 G=(V, E), 

输出: 6 的 强 连通 分 支 列表 。 

方法 : 


COUNT — 1; 
for all v in V do mark v “new”; 
initialize STACK to empty; 
while there exists a vertex v marked "new" do SEARCHC(v) 
end L1 


例 5.8 考虑 图 5-13 的 深度 优先 生成 森林 ， 计 算 LOWLINK 后 又 得 到 的 结果 如 图 5-16 所 示 。 第 
一 个 SEARCHC 调用 终止 在 SEARCHC(3) 。 当 检测 边 (3，1) 时 ， 将 LOWLINK[3] 设 置 为 MIN(1, 3) 
=1。 当 返回 SEARCHC(2) 的 时 候 ， 将 LOWLINK[2] 设 置 为 MIN(2，LOWLINK[3]) =1。 然 后 ， 调 
用 SEARCHC(4) ， 考 虑 边 (4，3) 。 由 于 3 <4， 并 且 3 仍 在 STACK H, 将 LOWLINK[4] 设 置 为 MIN 
(3, 4) =3。 





"——'E 1: 


LOWLINK [1] = ! (1) 





一 一 一 
一 一 
一 一 


LOWLINK [3] = 1 LOWLINK [4] = 3 
图 5-16 计算 LOWLINK 后 的 生成 森林 


然后 返回 SEARCHC(2) ， 并 将 LOWLINK[2] 设 置 为 LOWLINK[4] 和 LOWLINK[2] 当 前 值 (也 
就 是 1) 中 的 较 小 值 。 由 于 后 者 更 小 ，LOWLINK[2] 不 改变 。 返 回 到 SEARCHC(1), 设置 LOW- 
LINK(1]3y MIN(1, LOWLINK[2]) =1。 如 果 考 虑 边 (1，4) ， 由 于 (1，4) 为 一 条 前 向 边 且 第 10 
fj SEARCHC 的 条 件 由 于 4 > 1 而 不 满足 ， 那 么 将 不 会 有 什么 行为 发 生 。 

接着 ， 调 用 SEARCHC(5) ,由 于 4 <5 H4 # STACK H, 27X y1(5, 4) 4d LOWLINK[5] 设 
置 为 4。 当 再 次 返回 SEARCHC(1) 的 时 候 ， 设置 LOWLINK[1] 为 其 之 前 值 1 和 LOWLINK[5] 之 间 
的 较 小 值 ， 产 生 1。 

然后 ， 由 于 已 经 考虑 了 所 有 由 1 引出 的 边 ， A LOWLINK[1] =1, 发 现 1 为 强 连通 分 支 的 根 。 
该 分 支 包含 1 和 在 栈 中 位 于 1 以 上 的 所 有 顶点 。 由 于 1 为 访问 到 的 第 一 个 顶点 ， 顶 点 2、3、4 和 
5 都 按 序 位 于 1 之 上 。 因 此 ， 栈 被 清空 ， 并 且 将 顶点 1、2、3、4、5 的 列表 作为 C 的 一 个 强 连 通 
分 支 输出 。 

”其 他 的 强 连通 分 支 为 171 和 16，8} 。 从 顶点 6 开始， 计算 LOWLINK 并 找 出 强 连通 分 支 留 给 
读者 来 完成 。 注 意 ， 最 后 碰 到 的 强 连通 分 支 的 根 依 次 为 1、7、6。 口 

定理 5.4 在 一 个 包含 n 个 顶点 、e 条 边 的 有 向 图 G 中 ， 算 法 5.4 能 够 在 O(MAX(n，e) ) 时 
间 内 正确 地 找到 G 的 强 连通 分 支 。 

证 明 : 很 容易 验证 ， 调 用 一 次 SEARCHC(2*) 所 花费 的 时 间 为 与 顶点 所 引出 的 边 数 成 比例 的 
时 间 加 上 一 个 常数 ， 不 包括 对 SEARCHC 的 递归 调用 。 因 此 ， 由 于 在 任何 顶点 上 ， 仅 调用 
SEARCHC 一 次 ， 所 以 对 SEARCHC 的 所 有 调用 所 需要 的 时 间 同 顶点 数 加 上 边 数 成 比例 。 算 法 5.4 
中 除去 SEARCHC 的 部 分 已 经 可 以 在 O(n) 时间 内 实现 。 因 此 ， 证 明了 所 需 时 间 界 。 

为 证 明 此 证 明 的 充分 性 ， 当 SEARCH(w) 终 止 时 ， 通 过 对 已 终止 SEARCHC 调用 的 次 数 进行 
归纳 ， 可 正确 计算 LOWLINK[v] 。 由 SEARCHC 的 第 12 ~ 16 77, vo 成 为 强 连 通 分 支 的 根 ， 当 且 仅 
35 LOWLINK[v] =v。 进 一 步 ， 按 引 理 5.8 的 要 求 ， 输 出 的 顶点 恰好 是 * 的 后 代 ， 它 们 并 不 位 于 
根 在 v 之 前 被 找到 的 分 支 中 。 即 ， 在 栈 中 v 之 上 的 顶点 为 v 的 后 代 ， 由 于 它们 仍然 处 于 栈 中 ， 在 
v 之 前 没有 找到 它们 的 根 。 

为 证 明正 确 地 计算 了 LOWLINK， 在 图 5-15 中 有 两 个 地 方 需要 注意 ，LOWLINK[v] 可 以 接收 小 
于 vb 的 值 ， 也 就 是 在 SEARCHC 的 第 9 和 11 行 。 在 第 一 种 情况 下 ，vw 为 v 的 儿子 ，LOWLINK[w] 
<v。 那 么 ， 存 在 顶点 x =LOWLINK[w]， 通 过 一 条 交叉 边 或 回 向 边 ， 从 ow 的 后 代 y 可 达 。 并 且 , 含 
有 ?的 强 连通 分 支 的 根 7 为 w 的 祖先 。 由 于 x «v, 有 rr<v， 因 此 7 为 v 的 某 个 祖先 。 所 以 ,可 以 看 
到 LOWLINK[v] 至 少 同 LOWLINK[w] 一 样 小 。 

在 第 二 种 情形 ， 第 11 ARM 到 顶点 w «o 的 交叉 边 或 回 向 边 ， 尚 未 找到 其 强 连 通 分 支 
C, TE C 的 根 > 上 所 调用 的 SEARCHC 还 没有 终止 ,因此 7 必定 为 v 的 祖先 。( 由 于 r<w<v,r 要 
么 位 于 "的 左 侧 ， 要 人 么 是 * 的 祖先 。 但 是 ， 如 果 r 在 "的 左 侧 ，SEARCHC(r) 可 能 不 会 终止 。) 这 
再 次 表明 ，LOWLINK[v] 应 该 至 少 同 w 一 样 小 。 

还 必须 证 明 ， 计 算 LOWLINK[v] 值 时 SEARCHC 是 比较 慢 的 。 相 反 地 ， 假 定 存在 » 的 后 代 x, 
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有 从 x 到 y 的 交叉 边 或 回 向 边 ， 并 且 含 有 7 的 强 连 通 分 支 的 根 为 v 的 祖先 。 必 须 证 明 ， 至 少将 
LOWLINK 设置 为 同 y 一 样 小 。 

情形 1 x=v。 由 归纳 假设 和 引 理 5.9， 可 以 假设 迄今 为 止 找 到 的 所 有 强 连通 分 支 都 是 正确 
Bj. 那么 ， 由 于 SEARCH(r) 还 未 终止 ，y 必定 还 处 于 STACK 中 。 因 此 , 第 11 行 将 LOWLINK[wv] 
设置 为 y 或 更 小 的 值 。 

情形 2 «Xv, Hc Hv 的 儿子 ,x 为 v 的 后 代 。 那 么 ， 由 归纳 假设 ， 当 SEARCHC(z) 终 止 
人 时，LOWLINK[zj 已 经 设置 为 y 或 更 小 值 。 在 第 9 行 ，LOWLINK[v] 设 置 为 已 经 不 能 再 小 的 值 。 

口 


5.6 路 径 查 找 问题 


本 节 将 考虑 两 种 频繁 出 现 的 与 顶点 间 路 径 有 关 的 问题 。 在 接 下 来 的 描述 中 , 设 6G 为 有 向 图 。 
Cr 同 G 有 相同 的 顶点 集 ， 但 是 它 含有 一 条 从 sv 到 w 的 边 ， 当 且 仅 当 在 C 中 存在 一 条 从 vv 到 w 
的 路 径 ( 长 度 为 0 或 更 长 ), 图 G* 称 为 G 的 ( 自 反 和 ) 传 递 闭 包 。 

与 寻找 图 的 传递 闭 包 紧密 相关 的 问题 是 最 短路 径 问 题 ( shortest-path problem), WF G 中 的 每 
条 边 e， 赋 予 一 个 非 负 的 代价 c(e) 。 一 条 路 径 的 代价 定义 为 路 径 中 各 条 边 的 代价 总 值 。 对 于 顶点 
的 每 个 有 序 对 (v，w) ， 最 短路 径 问 题 就 是 找到 从 v 到 w 的 所 有 路 径 中 的 最 小 代价 。 

对 于 传递 闭 包 和 最 短路 径 问 题 ， 隐 含 在 已 知 的 最 佳 算法 后 面 的 思想 是 找 出 每 对 顶点 之 间 所 
有 路 径 的 (无 限 ) 集 合 的 (容易 的 ) 特 殊 情 形 。 为 了 讨论 更 一 般 的 问题 ， 下 面 引 入 一 个 特定 的 代数 
结构 。 

定义 ” 闭 半 环 (closed semiring) 是 一 个 系统 (S，+ ，，，,0,，1)， 其 中 S 为 元 素 集合 ，+ 和 ， 
为 对 S 的 二 元 操作 ， 满 足下 述 5 PER: 

1.(S，+ ，0) 为 一 个 独 异 点 (monoid) ， 也 就 是 说 ， 在 + 下 是 闭 的 [ 即 对 于 S 中 所 有 的 ea ob, 
a+beS]，+ 是 结合 的 [ 即 对 于 S 中 的 所 有 a、8 和 ec, a+(b+c)=(a+b)+c], 县 0 为 一 个 单 
位 元 (identity)[ 邯 对 于 S 中 所 有 的 a,a+0=0+a=a]。 同 样 地 ，(S， ,1) 也 为 一 个 独 异 点 。 
也 假定 0 为 一 个 零 化 子 (annihilator) ， 即 ae .0=0.a=0。 

2. + 符合 交换 律 (commutative) , WR X a+b=b+a, JE B E Xi (idempotent), Haa 
=a。 

3. + Æ+ LASS Hee (distribute), HE, a*(b«c)za-bsa-c, #E(b+e)-a=b. 
a *C* de 

4. 如 果 al，a,，…，a;，… 为 S 中 元 素 的 可 数 序列 ， 那 么 a, +a +…+ai+… 存 在 并 且 叭 
一 。 进 一 步 地 ， 结 合 律 、 交 换 律 和 短 等 性 可 以 同 有 限 和 一 样 适用 于 无 限 和 。 

5. - 在 可 数 无 限 和 同 有 限 和 一 样 必定 符合 分 配 律 (这 一 点 没有 遵循 性 质 3)。 因 此 (4) 和 (5) 
RAR 

(Ea): (X5) =- 有 = 了 (X5) 
$5.9 下 面 3 个 系统 为 闭 半 环 。 

1. WS,=({0, 1}, +, -,0, 1), RUNE REIHE: 


那么 ， 容 易 验证 性 质 1 ~3。 对 于 性 质 4 和 5， 注 意 到 可 数 和 为 0 当 且 仅 当 所 有 的 项 为 0。 
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2. WS,=(R, MIN, +, +œ, 0), HP RBS +o 的 非 负 实 数 集 。 易 验 证 ， +m 为 
MIN 的 单位 元 ， 且 0 为 + 的 单位 元 。 

3. 设 也 为 有 限 字 母 表 ( 即 一 个 符号 集合 ) ，$; = (F;, U, +, Ø, lel), 其 中 ， F.H 
也 的 有 限 长 度 符号 串 集 合 族 ， 包 含 空 串 e( 即 长 度 为 0 的 串 ) 。 在 此 ， 第 一 个 运算 子 为 集合 的 并 ， 
* 表示 集合 的 串联 。U 的 单位 元 为 名， 而 的 单位 元 为 {si 。 读 者 可 以 验证 人 性质 1 ~3。 对 于 性 
质 4 AS, 注意 到 ， 如 果 定 义 xe (4, U4,U…) 当 且 仅 当 对 于 某 个 i， 有 %e4,， 则 可 数 的 集合 并 
操作 将 按 其 方式 进行 。 口 

分 析 闭 半 环 主要 集中 在 称 为 闭 包 的 一 元 操作 ， 记 为 * 。 如 果 (S，+ ，，，0，1) 为 闭 半 环 ， 
且 ae5， 则 定义 a* 为 Eoa', 其 中 =1 且 a'=a-: ar!。 也 就 是 说 ，a* 为 无 穷 和 1+a+a'a 
+a "a* a+…。 注意 ， 闭 半 环 定义 的 性 质 4 确保 a * eS。 性 质 4 和 5 隐 含 着 a* =1+a.a*。 
注意 , 0* =1* =1, 

例 5. 10 参考 例 5.9 中 的 半 环 5,，5, 和 5,。 对 于 5,,，a* =1, 其 中 ea=0 或 1。 对 于 S,, 对 
MAER Pa, ax =0, HFS, 对 所 有 AeF;, A* = {sl Uirae l kz1 Hx, eA, HH 
lzisk|, 例如 ,，{a, b] * ie, a, b, aa, ab, ba, bb, aaa, ---}, M Rem Any 
HB, ESZE., CL, FAE»), Hp, AD BARE X MER. 

现在 ,假定 有 向 图 G = (V,E) 中 ， 每 条 边 用 某 个 闭 半 环 (S，+ ，…, 0, DAS RR 
标记 。 将 路 径 标 记 (label of a path) 定义 为 路 径 中 边 的 标记 的 积 (，) ， 接 顺 序 取 这 些 边 标记 。 作 
为 一 种 特殊 情形 ， 华 长度 的 路 径 标记 为 划 ( 半 环 的 . 标记) 。 对 于 每 对 顶点 (v，w) ， 定 义 c(v, w) 
Av 和 w 之 间 所 有 路 径 标记 的 和 。c(v，w) 将 作为 从 bv 到 w 的 代价 。 为 了 便利 ， 空 路 径 集 合 的 和 
为 0( 半 环 的 + 标记 ) 。 注 意 ， 如 果 G 有 环 ， 则 在 v 和 zw 之 间 可 能 存在 无 穷 多 条 路 径 ， 但 是 闭 半 环 
的 公理 保证 e(o, w) EREK. 

例 5.11 考虑 图 5-17 中 的 有 向 图 ， 其 中 每 条 边 用 例 5. 9 中 半 环 S 的 一 个 元 素来 标记 。 路 径 
v, w, x 的 标记 为 1. 1 =1。 从 w 到 w 的 简单 四 路 标记 为 1 . 0 =0。 实 际 上 ， 从 w Bw 长 度 大 于 0 
的 每 条 路 径 都 有 标记 0。 然 而 ， 从 w Ww 的 零 长 度 路 径 ， 其 代价 为 1。 最 终 , ce(w, w) =1。 O 

现在 给 出 一 个 算法 为 所 有 顶点 对 v 和 w 计算 ce(v, w), WE 0 
的 基本 单元 时 间 步 为 任意 闭 半 环 的 运算 子 + 、… 以 及 * 。 当 然 ， 1 
对 于 某 些 结构 ， 诸 如 字母 表 上 所 有 字符 串 集 组 成 的 集合 ， 并 不 清 9 et o 
楚 能 否 实现 这 些 操作 ， 更 不 用 说 在 “单元 时 间 ” 内 了。 然而 ， 对 于 
将 要 使 用 的 半 环 ， 则 很 容易 执行 这 些 操 作 。 

算法 5.5 计算 顶点 之 间 的 代价 。 

A: 有 向 图 G=(V, E), EP V= fv, v, oo, vul, WERKE (VxV) 一 S$， 其 中 (5S， 
+ ，，，0，1) 为 闭 半 环 。 如 果 (v,, 45) 不 在 E 中 ， 则 取 Llo, v) =0。 

输出 对 所 有 在 1 ~ 之 间 的 i 和 j，5 中 的 元 素 c(v;，v,) 等 于 所 有 从 sv 到 5 的 路 径 上 路 径 标 
记 之 和 。 

Aik: 对 所 有 的 1<isn, 1<j<n ROSk<n, 计算 Cs;。 其 含义 在 于 ,Gt 为 从 4 到 包 的 所 有 
路 径 标 记 之 和 ， 可 能 除 两 个 端点 外 ， 路 径 上 的 所 有 顶点 都 在 集合 1v,，v,，…， vul 中 。 例 如 ， 路 
Fry, 9, oF Ca ChP, BERE C% 中 。 算 法 如 下 : 


图 5-17 带 标 记 的 有 向 图 


O 集合 4 与 B 的 串联 为 集合 ix1 =y, yeAHzeB), 表示 为 4.B。 
O 正如 将 在 9.1 节 中 要 讨论 的 ， 读 者 不 能 忽视 这 种 情形 和 不 确定 性 有 穷 自 动机 ( Hopcroft 和 Ullman[ 1969] ， 或 
者 Aho 和 Ulman[1972] ) 之 各 的 相似 之 处 。 顶 点 为 状态 ， 边 的 标记 为 来 自 某 个 有 穷 字 母 表 的 符号 。 





a 








begin 
for i — 1 until n do C} <— 1 + /vy vi): 
fori si,j sn and i #¥ j do CY — lv, vj); 
for k «— 1 until n do 
for 1 zi,jzndo 
Cb—Chi'-ch'-(CR»0*- CE; 
for 1 si, j = n do c(v;, y;) | C} 


人 人 人 


口 
定理 5.5 算法 5.5 使 用 O(n ) 个 半 环 的 +、， 和 * 操 作 计 算 c(v,, w), 其 中 1&i, jen, 
证 明 : 易 验 证 第 5 行 执行 了 nr 次， 每 次 需要 4 个 操作 ,第 1、2 和 6 行 的 for 循环 每 个 重复 至 
Enk. Alt, O(n’) MAE EH. 

为 证 明正 确 性 ， 对 归纳 证 明 C5; 为 所 有 路 径 标 记 之 和 ， 这 类 路 径 从 vB v, A (PRA SP) 没 
有 索引 大 于 天 的 中 间 顶 点 。 由 第 1 和 2 行 ， 归 纳 的 基 上 =0 显然 ， 因 为 任何 这 样 的 路 径 长 度 都 为 
0， 或 者 由 唯一 的 边 组 成 。 由 第 5 行 得 出 归纳 步 ， 由 于 从 vw 到 5 没有 中 间 顶 点 索引 大 于 & 的 一 条 路 
径 ， 则 

i) 没 有 高 于 k-1 的 中 间 顶 点 (项 CS’), RA 

ii) 由 沁 指 向 w， 再 由 尺 指向 岂 某 些 次 (可 能 为 0 次 ) ， 最 终 由 v 指 向， 整 条 路 径 上 都 没有 高 
于 上 -1 的 中 间 顶 点 [项 Co (0) e Cy le 

闭 半 环 定律 保证 算法 的 第 5 行 正 确 计算 这 些 路 径 的 标记 之 和 。 口 


5.7 传递 闭 包 算法 


将 算法 5. 5 应 用 于 两 种 有 趣 的 情形 。 第 一 种 为 例 5. 9 中 描述 的 闭 半 环 8, TE SP, BERG 
加 法 和 乘法 ， 且 因为 0* =1* =1， 执 行 * 也 很 容易 。 实 际 上 ， 由 于 1 为 的 单位 元 ， 可 以 使 用 
下 式 取代 算法 5. 5 中 的 第 5 Fo 


Cc ce e cp (54) 
为 了 计算 图 的 自 反 传递 闭 包 ， 定 义 标 记 函 数 
" o 如 果 (v，w) 是 一 条 边 
0 如 果 不 是 


Meo, w) =1 当 且 仅 当 从 v 到 w 之 间 存 在 一 TEKER O RATO MRE, AREA, 
1 定律 ， 这 很 容易 验证 。 


例 5. 12 AUEH 5-18 中 的 图 ， 暂 时 忽视 边 上 的 数字 。 如 下 给 定 标记 函数 O, v). 


K ViVi) 


然后 , 算法 5.5 中 的 第 1 行 设 定 C == =1。 对 于 izj, S2 行 设 定 C =1(v,, v), E 
此 ， 对 于 GATIME. 





O 很 自然 地 将 这 种 观测 解释 为 “ 仅 考虑 无 环 路 径 是 足够 的 " 。 然 而 ， 应 该 注意 到 ， 用 式 (54) 来 取代 第 5 行 ， 算 法 
5.5 将 基于 路 径 集合 来 计算 其 和 ， 该 集合 包含 所 有 的 无 环 路 径 ， 但 也 包含 了 一 些 其 他 的 路 径 。 
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Vi Ve Vy 
viIl 1! 1 
vvil 1 9 
vy,/0 1. 1 
C$ 
现在 设 定 上 =1， 用 式 (54) 取 代 第 5 行 ， 并 执行 第 4 和 5 行 的 循环 。 例 如 ，Ca = C% + C2 - 
C =0+1 .1=1。 图 5-19 中 的 表 给 出 了 Ci. CRI C; 口 
V Ve Vs W Ve Vy 
wt 1! 1 :| 1 1 
wji 1 i wii 1 1 
w10 1 ! will 1 1 





Cl Ch = Ch = ely, v) 
图 5-19 GÈ 
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5.8 最 短路 径 算 法 


为 计算 最 短路 径 ， 使 用 例 5.9 中 讨论 的 第 2 类 闭 半 环 ， 也 就 是 包含 + % 的 非 负 实 数 。 回 顾 一 
下 ,实数 中 的 加 运算 为 MIN， 乘 运算 则 为 加 和 。 即 要 考虑 结构 (R，MIN，+ ，+ o ，0) 。 在 例 5.10 
中 观察 得 到 ， 对 于 所 有 的 ae R，a * =0， 因 此 可 以 删除 算法 5. 5 中 第 5 行 的 * 操作 ， 取 而 代 之 以 

C,—MIN(G; , Cy! Cz) (5-5) 

一 般 地 ， 式 (5-5) 认为 不 经 由 高 于 兴 的 顶点 且 从 w 到 w 的 最 短路 径 ， 要 短 于 

i) 不 通过 高 于 内 -的 项 点 的 最 短路 径 ， 且 l 

ii) 从 到 办， 再 到 v 且 尽 可 能 短 距 离 的 路 径 ， 在 这 些 点 之 间 ， 没 有 通过 高 于 w WA. 

为 将 算法 5. 5 转化 为 最 短路 径 算法 , BI, wv) 为 边 (v,，v) 的 代价 ， 若 边 不 存在 则 其 值 为 ” 1 
+ o 。 然 后 用 式 (5-5) 取 代 第 5 行 ， 并 且 由 定理 5.5, 算法 5.5 得 到 的 c(w，) 值 将 是 w 和 之 间 i 
所 有 路 径 中 路 径 代 价 ( 即 边 的 代价 之 和 ) 最 小 的 。 


5-20 ”最 短路 径 计算 


例 5.13 再 次 考虑 图 5-18 中 的 图 。 设 每 条 边 的 标记 为 图 中 表示 的 。 图 5-20 给 出 了 函数 /、 
C, C, Cf C, pin, C, = MIN(C,, Ch +C) =MIN(8, 542) =7。 oO | 
WOW Vs v ve Vs | 
vi2 8 5 wlio0 8 S 
v,|3 9 o $|3 0 œ% 
njo 2 9 w|i 2 0 
Kv, vy) Ch 
YQ Ve Vs WOW Vs V V Vs 
ui0 8 5 10 8 S vlI0 7 5 
$13 0 8 $|3 0 8 $13 0 8 
vg | œ 2 0 Vy 5 2 0 Vs 5 2 0 
Ch C Ch = c(v, vy) 
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5.9 路径 问题 与 矩阵 乘法 


设 ($S，+ ，'，0,，1) 为 闭 半 环 。 可 以 用 通常 的 和 与 积 ， 定 义 $ 中 元 素 的 nxn BEES wR 
Æ, WA, BAC 分 别 包含 元 素 oj bA, APIsi, j<n。 然 后 ,对 于 所 有 的 i 和 j, C=A+ 
也 意味 着 c; =a, +b;， 且 对 所 有 的 i 和 j, C=A -BERA C= Eiaa’ 外。 容易 验证 下 列 引 理 。 

引 理 5. 10 设 (3S，+ ，'，，0，1) 为 一 个 闭 半 环 ， 且 M, 为 $ 上 nxn 和 矩阵 的 集合 。 令 +, 和 
,分别 为 矩阵 的 加 和 乘 ，0, 为 每 个 元 素 均 为 0 WER, BL 1, 为 对 角 线 上 元 素 为 1， 其 余 元 素 为 0 
AYE. BRA, (M,, +,, °,, 0,, 上) 为 闭 半 环 。 

证 明 : 留 作 练习 。 S m 

WC-(V, E) — Him, HPV=(,, v, =, o) BURIENIES.S 中 一 样 ， BEE (V 
x V)—S HRR, WA Wn xn 矩阵， 其 第 站 元 为 1(v,，v)。 下 一 个 引 理 将 通过 算法 5.5 执 
行 的 计算 同 S 上 nxn 和 矩阵 的 半 环 MPA AS 的 计算 关联 起 来 。 

引 理 5. 11 设 6 和 4。 如 上 所 述 ， 则 4s 的 第 站 个 元 素 为 c(v,, v). 

证 明 : Ac = ELA HP, AL EHF izl, A =A, AS’. HMM EAA, BLE 
得 At 的 第 六 个 元 素 为 从 w 到 yw 长度 为 大 的 所 有 路 径 的 代价 之 和 。 随 后 即 可 得 到 4: 的 第 六 个 元 素 
为 从 5 到 久 的 所 有 路 径 代价 之 和 。 口 

作为 引 理 5. 11 的 结果 ， 可 将 算法 5.5 看 作为 计算 矩阵 闭 包 的 算法 。 定 理 5.5 已 经 阐 
明 ， 算 法 5.5 需要 0(m ) 个 标量 运算 (scalar operation)( 即 取 自 半 环 的 +、: 和 * 运 算 )。 显 
然 ， 和 矩阵 乘法 的 算法 要 求 O( n^ ) 个 标量 运算 。 下 面 证 明 ， 当 考虑 取 自 闭 半 环 的 标量 时 ， 两 
个 矩阵 乘积 的 计算 在 计算 上 等 价 于 矩阵 闭 包 的 计算 。 也 就 是 说 ， 给 定 任 意 算法 来 计算 乘积 ， 
可 以 构造 算法 来 计算 闭 包 ， 反 之 亦 然 ， 并 且 执 行 次 数 的 阶 也 将 相同 。 在 第 6 章 中 更 好 地 表 
达 了 该 结果 ， 并 证 明 当 其 标量 形成 一 个 环 的 时 候 ， 少 于 O(n’) 次 操作 就 能 满足 矩阵 的 乘法 。 
此 构造 分 为 两 个 部 分 。 

定理 5.6 如 果 可 以 在 T(n) 时 间 内 计算 在 闭 半 环 上 任意 半 xz 低 阵 的 闭 包 ， 其 中 FT(n) 满 足 
T(3n) <27T(n)°, Wd dk o, ETE nxn EM ABIRE Mn) X £ Min) 
<cT(n), 


证 明 :; 假定 要 计算 乘积 4. B, AM Bn xn BR, KEER 3n x3n 和 矩阵 


o0» 


因此 


1, A A+B 
X'-L«X«XY-|0 I B 
0 0 


O 由 于 最 坏 情况 下 FT(m) 为 0(m ) ， 这 是 一 个 合理 的 假定 。 实 际 上 ， 在 定理 的 表述 中 ，27 可 替换 为 任何 其 他 的 
常数 。 
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由 于 可 以 从 右上 角 读 取 4. 有 8， 因此 可 得 M(n) <T(3n) «27T(n), L] 
定理 5. 6 的 证 明 可 用 下 面 的 图 形 解释 。 考 虑 图 C， 将 其 包含 的 3n TOR ET, 2, =, 3n} 划 
分 为 3 个 集合 由 =11， 2，…， n}, VS Íin*1, n+2, =, WlMV, = {2n+1, 2n+2, <, 


3n]. [BUE C 的 每 条 边 ， 尾 部 顶点 在 由 中 且 头 部 项 点 在 多 中， 或 者 其 尾部 顶点 在 风 中 且 头 部 顶点 
E V,rh. E 5-21 BHA. RAAB An xn, KA 的 第 六 个 元 素 为 从 顶点 i 到 顶点 
n+j 的 边 的 标记 ， 且 8B 的 第 站 个 元 素 为 从 顶点 n+i 到 顶点 2n +j 的 边 的 标记 。 积 4: B 的 第 站 个 
元 素 碰巧 是 从 顶点: 到 顶点 2n +j 的 路 径 上 标记 之 和 ， 这 是 由 于 每 条 这 样 的 路 径 都 包含 从 顶点 i 
到 某 个 顶点 k(n <k<2n) 的 边 ， 接 着 是 一 条 从 顶点 大 到 顶点 2n +j 的 边 。 因 此 ， 所 有 从 i 到 2n +j 
的 路 径 上 标记 之 和 与 4 .号 中 的 第 六 个 元 素 相同 。 





图 5-21 定理 5.6 的 图 形 解释 


现在 继续 证 明定 理 5. 6 的 逆 命 题 。 给 定 和 矩阵 乘法 算法 ， 忽 略 常数 因子 ， 存 在 相同 速度 的 闭 包 
算法 。 
定理 5.7 如 果 能 够 在 M(n) 时间 内 ， 计 算 闭 半 环 上 任意 两 个 nxn BEAR, AFM) 
ER MQn) 之 4M(n)， 那 么 存在 常数 c<， 使 得 计算 任意 算 阵 闭 包 的 时 间 TC(n) 满足 T(n) <eM(n)。 
证 明 ; UX nxn ERE, 首先 考虑 n 为 2 的 乘 方 ， 假 定 为 24。 将 天 分 解 为 大 小 为 21 x2*-! 
的 4 个 矩阵 ， 
A B 
x*-(c D) 
利用 引 理 S. 11, ALE X SURE C = (V，E) ， 其 中 顶点 划分 为 大 小 为 2-! 的 两 
ARAVA V. BEAR V.P LIII, ABER D 表示 中 顶点 之 间 的 边 。 和 矩阵 8 表 
AMV PRA V, PUA, ABE C 表示 从 岂 中 顶点 到 只 中 顶点 的 边 。 排 列 如 图 5-22 
所 示 。 
现在 ， 从 史 中 的 顶点 到 同一 集合 中 的 顶点 风 的 路 径 必 s 


为 下 述 两 种 形式 之 一 ， mA 
1 永远 不 离开 V,, SUR 4 Cx MO p 
2. SF k=l, E&isk, FEDA w, x, nAz, ”4 


其 中 心 和 z 在 只 中 , x 和 y 在 记 中 ,使 得 在 V 中 有 从 到 w， d 

的 路 径 , 沿 着 到 «的 边 ， 再 沿 着 V, PU — ARIES BR y, A 图 5-22 Hic 

沿 着 到 达 z, 的 边 ， 然 后 沿 着 只 中 的 一 条 路 径 到 达 w, REFA, Aka, RE V PREA 
v. PH 5-23 给 出 其 描述 。 











图 5-23 满足 条 件 2 的 路 径 


很 容易 将 满足 条 件 1 或 2 的 路 径 的 标记 之 和 看 作为 (4 + B.D*. C) *。 也 就 是 说 ， 在 图 
5-23 P, B- D*« - C 表示 从 w, 到 zx, 到 yy. 再 到 z 的 路 径 。 因 此 ，4 + B.D* .C 表示 太 中 顶点 之 间 
的 路 径 ， 这些 路 径 只 是 一 条 边 ， 或 者 直接 转 到 V, PEVE, SAAV 中。 可 以 将 V, PUR C 
间 的 所 有 有 路径 连续 表示 为 由 4+B* D» - C 表示 的 路 径 。 因 此 ，(4 +B8. D*，C)* 表 示 V 中 顶 
点 之 间 的 所 有 路 径 。 因 而 ，X* 的 左上 部 分 包含 (A +B.D* -C)*, 

设 E=(4+B.D*x.C)*。 出 于 相似 的 原因 ， 可 以 将 关 * 的 4 个 部 分 写 为 : 

. E E-B-D* E F 
X'z 二 
(cs De (e x) 
可 以 通过 下 列 步 又， 计算 这 4 个 部 分 EE、F、G 和 HH: 
T, =D’ 


H=T,+¢>T, 
LEPRE? x2! REY 2 个 闭 包 、6 次 乘法 以 及 2 次 加 法 。 因 此 ， 有 : 
T(1)=1 
T(2:) x2T(2 ) +6M(2*"') »2-2*?. k>1 
式 (56) 右 边 的 3 项 分 别 表示 闭 包 、 乘 法 和 加 法 的 代价 。 要 求 存 在 常数 c<， 对 所 有 的 ， 
T(2*) <cM(2*) 满 足 式 (5-6)。 由 于 可 以 将 c 选 为 任意 大 ， 归 纳 基础 =0 时 是 显然 的 。 在 归纳 步 ， 
MEWAA TO) <cM(2*“!)。 从 定理 的 假设 M(2n) 24M(n), 有 M(2:"') 22^, [È 
意 ，M(1) =1]。 因 此 ， 从 式 (5-6) 
T(2*) x (2c :8)M(2*) 
再 次 ， 由 定理 的 假设 ，M(2 生 ' ) «1/4MQ*), ， 有 
T(2*) <(c/2 «2)M(2*) . (5-7) 
如 果 选 择 c>4， 式 (5-7 ) 意 味 着 7(2 ) <cM(2')， 正 是 要 证 明 的 。 
如 果 n 不 是 2 的 乘 方 ， 可 以 将 和 嵌入 到 维 数 为 2 的 乘 方 的 大 矩阵 中 ， 其 形式 为 


(5-6) 
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X 0 
(o I 
其 中 了 为 具有 最 小 可 能 大 小 的 单位 方 阵 。 这 将 使 矩阵 的 大 小 至 多 为 原来 的 两 倍 ， 并 因此 通过 8 的 
因子 来 增加 常量 。 因 此 ， 存 在 新 的 常数 ， 无 论 ” 是 否 为 2 的 乘 方 ， 对 所 有 的 n, 有 了 T(n) <c'M(n)。 


o 

推论 1 计算 布尔 矩阵 的 闭 包 所 需要 的 时 间 等 同 于 计算 相同 大 小 的 两 个 布尔 矩阵 的 乘积 所 需 
要 的 时 间 。 

第 6 章 将 看 到 计算 布尔 矩阵 乘积 的 渐 近 快速 算法 ， 因 此 表明 ， 可 以 在 少 于 O(m ) 的 时 间 内 计 
算 图 的 传递 闭 包 。 

推论 2 用 操作 MIN 和 + 起 到 标量 加 和 乘 的 作用 ， 计 算 非 负 实数 矩阵 的 闭 包 所 需要 的 时 间 
与 计算 两 个 该 类 型 矩阵 的 乘积 所 耗费 的 时 间 同 阶 。 

到 目前 为 止 ， 对 于 所 有 顶点 对 的 最 短路 径 问 题 ， 没 有 已 知 的 少 于 om 时 间 的 方法 ， 其 中 。 是 
常数 。 


5.10 iia 


在 多 数 应 用 中 ， 可 能 仅 要 找到 从 一 个 顶点 ( 源 ) 开 始 的 最 短路 径 。 实 际 上 ， 可 能 期 望 仅 找到 
两 个 特定 顶点 之 间 的 最 短路 径 ， 但 是 较 之 最 佳 单 源 算法 ， 对 此 问题 在 最 坏 情 况 下 还 没有 已 知 的 
比 其 更 有 效 的 算法 。 

对 于 单 源 问 题 ， 尚 未 有 同 闭 半 环 和 算法 5. 5 相似 的 概念 。 并 且 ， 如 果 仅 了 解 存 在 一 条 从 源 开 
始 的 路 径 的 顶点 ， 则 问题 很 简单 ， 能 够 通过 许多 算法 ， 在 e 条 边 的 图 中 , 在 0(e) 时 间 内 完成 。 
由 于 没有 “考察 "过 所 有 边 的 算法 不 可 能 是 正确 的 ， 不 难 相信 ，0(e) 是 所 能 期 望 的 最 好 时 间 了 。 

当 提 及 找到 单 源 最 短路 径 时 ， 情 况 有 所 变化 。 虽 然 假定 算法 应 该 需要 超过 0(e) 时 间 是 没有 
什么 理由 的 ， 但 是 不 超过 0(e) 时 间 的 算法 并 无 人 所 知 。 将 讨论 一 个 O(n) 的 算法 ， 构 造 一 个 顶 
点 集 5， 这 些 顶 点 从 源 开始 的 最 短 距 离 是 已 知 的 。 在 每 一 步 ， 将 剩余 顶点 v 加 入 S， 该 顶点 从 源 
开始 的 距离 是 剩余 项 点 中 最 短 的 。 如 果 所 有 边 都 有 非 负 的 代价 ， 则 确保 从 源 到 "的 路 径 仅 通过 S 
中 的 顶点 。 因 此 ， 对 于 每 个 顶点 vw， 仅 需要 记录 从 源 开 始 ， 经 由 一 条 仅 通过 S 中 顶点 的 路 径 到 ， 
的 最 短 上 距离。 现在 形式 化 地 给 出 其 算法 。 

算法 5.6 单 源 最 短路 径 算法 (Dijkstra 算法 ) 。 

WA: 有 向 图 G=(V, E). Roy e V 以 及 从 边 映射 到 非 负 实数 的 函数 1。 如 果 (v,，v) 不 是 一 
RA, vo, WR Io, v)2g +o, JEH (v, v) =0。 

输出 : 对 每 个 eV， 所 有 从 vw 到 sv 的 路 径 P 中 边 的 标记 之 和 的 最 小 值 。 

方法 : 构造 集合 SGV， 使 得 从 源 到 S 中 每 个 顶点 "的 最 短路 径 整个 位 于 S 中 。 数 组 D[v] 包 
Bh v, v 仅 经 由 S 中 顶点 的 当前 最 短路 径 的 代价 。 图 5-24 给 出 该 算法 。 口 


S = {vo}; 
D[»] 一 0; 
for each v in V — {v,} de D[v]  Kv,, v); 
while 5 + V do 
begin 


Choose a vertex w in V — S such that D[w] is a minimum; 
add w to S; 
for cach v in V — S do 

Div] — MIN(D[v), D[w] + (w, v) 


PIAA PN” 








end 


图 5-24 Dijkstra 算法 
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9415.14. 2818525, BH, Se iv], Diy) 20, HFi=1, 2, 3. 4, D[v,]) 298 2. 
+œ, to. 10, 在 第 4~8 行 循环 中 的 第 一 次 迭代 时 ， 由 于 D[v,] =2 为 D 中 的 最 小 值 ， 选 择 w 
zv». Ma, Wat Dln] = MIN( + 0, 243) =5, D[v,] =MIN(10, 247) =9。 图 5-26 中 概括 
性 地 给 出 了 DD 中 的 值 序列 和 算法 5. 6 中 的 其 他 计算 。 a 





图 5-25 ” 带 标 记 边 的 图 





Iteration S w DÎw} Dj pw Div] Div) 
Initial — (w) - - 2 +o +00 10 
1 (ve, vi) v 2 2 5 +o 9 
2 {vo Viva} m 5 2 5 9 9 
3 [vo voe) Vs 9 2 5 9 9 
4 All v4 9 2 5 9 9 








5-26 ”基于 图 525, 算法 5.6 的 计算 


定理 5.8 算法 5.6 ILE BLUE GEN UE, WEO), 

证 明 : 同 在 第 5 行 中 选择 w 一 样 ， 第 7 -8 行 中 的 for 循环 要 求 0(n) 步 。 这 些 是 第 4 ~ 8 行 中 
while 循环 的 主要 代价 。 而 后 者 需要 执行 0(n) 次 ， 其 总 代价 为 0( 亚 ) 。 显 然 ,第 1 ~ 3 ARE 
O(n) BY fal. 

对 于 正确 性 ， 必 须 基 于 5 的 大 小 进行 归纳 证 明 ， 对 于 $ PHT, Dl vo] SFM v, SI v 的 一 
条 最 短路 径 的 长 度 。 而 且 ， 对 所 有 的 we 了 -S，D[o] 为 从 wm 到 ，" 且 除 " 本身 外 ， 路径 整 体位 于 5 
中 的 最 短路 径 的 长 度 。 

归纳 基础 。 上 S51 =1。 从 wm 到 其 本 身 的 最 短路 径 的 长 度 为 0， 从 m 到 ，" 且 除 " 本 身 外 ， 路 径 
整体 位 于 S 中 的 路 径 含 有 唯一 边 (w，?) KiE, 第 2 和 3 行 正确 地 初始 化 数组 也 。 

归纳 步 。 假 定 在 第 5 行 选择 顶点 w MRD w] PEA n 


到 w 最 短路 径 的 长 度 ， 那 么 必然 存在 一 条 最 短路 径 P。 除 w (v) (w) 
bh, BRE PME CA TRIE S 中 的 顶点 。 设 v 为 P 上 第 一 个 这 样 LÀ 
的 顶点 。 但 是 另 一 方面 ， 从 % 到 + 的 距离 却 比 D[w] 短 ,并且 ， ~ 


到 4 的 最 短路 径 除 v 本 身 外 ， 整 体位 于 S 中 。( 参见 图 5-27 ) 。 
因此 ， 由 归纳 假设 ， 当 选择 ww 时 ， 有 Div] <D[w], 矛盾。 得 
出 结论 ， 不 存在 路 径 P， 且 DU wl) AM v Bil w 的 最 短路 径 的 (vo) $ 
长 度 。 

由 第 8 行 ， 归 纳 假 设 的 第 二 部 分 ， 即 DLwj] 保 持 正确 性 


， 5-27 ”到 顶点 v 的 路 径 
显而易见 。 口 
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5.11 有 向 无 环 图 的 支配 集 : 概念 整合 


本 章 已 经 说 明了 设计 有 效 图 算法 的 几 种 技术 ， 诸 如 深度 
优先 搜索 和 合理 计算 顺序 的 安排 等 。 第 4 章 研究 了 许多 有 用 的 数据 结构 ， 用 于 表示 由 各 种 操作 来 
操纵 集合 。 本 章 将 通过 一 个 例子 说 明 ， 结 合 第 4 章 中 的 数据 结构 和 本 章 的 图 技术 可 以 设计 出 非常 
有 效 的 算法 。 具 体 就 是 使 用 离线 MIN 算法 、 不 相交 集合 合并 算法 和 2-3 树 ， 结 合 本 章 的 深度 优先 
搜索 技术 ， 为 有 向 无 环 图 寻找 支配 集 ( dominators) 。 

如 果 有 向 图 C= (V, 五) 的 顶点 到 了 中 每 个 顶点 都 存在 一 条 路 径 ， 则 以 顶点 OR, ER 
的 余下 部 分 ， 将 假定 C = (V, 五 ) 为 以 为 根 的 带 根 有 向 无 环 图 。 

如 果 从 根 到 w 的 每 条 路 径 都 包含 v， 则 顶点 "为 zw 的 支配 点 ( dominator) 。 每 个 顶点 是 其 本 身 的 
支配 点 ， 并 且 根 支配 着 每 个 顶点 。 顶 点 w 的 支配 点 的 集合 ， 可 依 其 在 从 根 到 w 的 最 短路 径 上 出 现 的 
顺序 线性 排序 。 将 最 靠近 w 的 w 的 支配 点 ( 除 w 本 身 之 外 ) 称 为 w 的 直接 支配 点 (immediate 
dominator) 。 由 于 每 个 顶点 的 支配 点 线性 排列 ， 可 用 一 棵 含有 根 r 的 树 表示 关系 “。 支配 w”， 该 树 称 
为 6 的 支配 树 (dominator tree) 。 支 配 集 的 计算 能 用 于 代码 优化 问题 ( 见 [ Aho 和 Ullman, 1973] 和 
[Hecht，1973] ) 。 

对 一 棵 有 。 条 边 的 带 根 有 向 无 环 图 ， 为 计算 其 支配 树 ， 需 要 开发 一 个 0(eloge) 算 法 。 该 算法 
主要 是 为 了 说 明 如 何 将 这 里 的 技术 同 前 一 章 结 合 起 来 。 该 算法 基于 下 述 3 个 引 理 。 

WC-(V, 五) 为 一 个 图 ，C = QV, E')8 GIF BI, MR(a, b) eE', SX asb, 4 
别 用 羽 和 之 表示 也 的 传递 闭 包 和 自 反 传 递 闭 包 。 如 果 (a，b) e E, BE ad, 

引 理 5. 12 W G-(V, E) APIS r 的 有 向 无 环 图 ,S$ = (V, T) 


为 带 根 r 的 图 6 的 深度 优先 生成 树 。 设 a, b,c 和 d 为 V 中 的 顶点 ， C © 
WE abbdchd, W(a, c) 和 (5，d) 为 前 向 边 。 然 后 ， 用 前 向 边 / / $N 
(ae，d) 取 代 前 向 边 (5，d) 不 会 改变 6 中 任何 顶点 的 支配 点 ( 见 图 5- 1 Q) ; i G) s 
28), P | 
证 明 : 用 边 (a, d) 取 代 G 中 的 边 (5，d) ， 设 C' 为 由 此 得 到 的 | / 


图 。 假 定 。 为 的 支配 点 ， 它 在 6 中 而 不 在 CH, WA, E CRE 
在 一 条 从 + 到 ww RBP, KUR BA, MFA, PEREC 
中 而 不 在 6 中 的 边 ， 路 径 必须 使 用 这 条 边 。 因 此 ， 可 以 写 P， rd 
a-sd-vu, 这 使 得 "必须 位 于 路 径 a3d E, 并且 v 相 异 于 a 和 d。 如 528 引 理 5.12 的 转化 

果 在 深度 优先 计数 中 ，a <v<8， 那 么 用 路 径 ascdd KEN P PRN ad, H 6 中 得 到 一 条 从 
"到 uw， 不 含 * 的 路 径 。 如 果 5 co cd, MAHE abd KRRP chit aod, HE G 中 得 到 一 


Kr Bw ERE v 的 路 径 。 由 于 a <y<1 或 者 5 <w<d， 所 以 在 6 中 存在 一 条 从 7r 到 w 且 不 包含 
v ARE. FIG. 


假定 为 w 的 关节 点 ,在 C' 中 但 不 在 GC 中 。 那 么 ,在 G 中 存在 一 条 从 + Bl w 且 不 包含 * 的 路 
径 P。 由 于 该 路 径 不 在 Ch, RE PERM bod, XE v (FMB bad E, JEB bev«d, 
因此 ， 在 6' 中 存在 一 条 路 径 rSamdav KE v, FB. 口 


引 理 5.13 设 C 和 3 与 引 理 5.12 中 的 定义 相同 。 设 ab, HA(a, b) AC 中 的 前 向 边 。 
如 果 不 存在 使 c<a Ha<d<b 的 前 向 边 (c，d) ， 也 不 存在 使 cdsb 的 交叉 边 (e，d) ， 那 么 ， 
删除 指向 5 的 树 边 不 会 改变 一 个 顶点 的 支配 集 ( 见 图 5-29。，) 
证 明 : 证 明 相似 于 引 理 5. 12。 B 
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Æ 5-29 引 理 5. 13 的 转化 


引 理 5.14 设 C 和 5 与 引 理 5.12 中 相同 ，(c，d) 为 6 的 一 条 交叉 边 ,， 5 为 Md RMR 
度数 的 共同 祖先 。 设 a 为 MINCIBTU [oT (v,w) 为 一 条 前 向 边 且 5<w<c|)。 如 果 ， 除 顶点 4 
外 ， 不 存在 进入 路 径 boc 上 任何 顶点 的 交叉 边 ， 那 么 用 前 向 边 (a，d) 取代 交叉 边 (c，d) 不 会 改 
AS 6 中 任何 顶点 的 支配 集 ( 见 图 5-30) 。 

证 明 : Ala, DRR G 中 的 边 (c，d) ，C' 为 由 此 得 到 的 图 。 假 定 顶点 "为 顶点 w 的 支配 
点 ， 在 6 中 但 不 在 C' 中 。 那 么 ，6 中 存在 一 条 从 + 到 ww 且 不 含 。 的 路 径 P。 显 然 , P 必定 包含 边 
(a, d), Bie, v 必定 在 生成 树 路 径 ab E, AW od RH aed 取代 a=>d， 由 此 在 6 中 
得 到 从 7 到 w 不 含 。 的 路 径 。 然 后 ， amused WU P RHA asd, P u ERE be ER 
w>b， 由 此 在 C 中 得 到 一 条 从 r 到 不 含 " 的 路 径 ， 矛 盾 。 

假定 。 为 w 的 支配 点 ， 在 6' 中 但 不 在 6 中。 那么 在 6 中 存在 一 条 从 7 到 w RA v HRB P 
BA, PORAC, d). HP EOS rocmedow, BF BUB CIT boc 上 (除外 ) 的 交叉 边 ， 
路 径 rye 必定 包含 路 径 adb 上 的 某 个 顶点 。 设 * 为 最 高 深度 数 的 这 类 顶点。 设 已 为 路 径 己 中 从 
r 到 x 的 一 部 分 ， 其 后 有 aad, REE PHA d 到 ww 的 部 分 。 设 P, IBR rbad, HAA P 中 
Kd Bl w 的 部 分 。 如 果 ， 位 于 P, 那么 v 必定 在 rd 上， 且 w>x。 如 果 ， 位 于 P, 那么 v 必定 
Erba 上。 由 于 a<x，C' 中 这 些 路 径 中 的 一 条 不 包含 %， 矛 盾 。 o 


一 一 一 ~ 





图 5-30 引 理 5. 14 中 的 转化 
显然 ， 重 复 应 用 引 理 5. 12 ~5. 14 中 的 转化 ， 直 到 它们 不 再 可 用 ， 将 把 C 转化 为 一 棵 树 。 由 





128 BSF 





于 转化 不 改变 支配 关系 ， 最 终 的 树 必 定 是 6 的 支配 树 。 这 将 是 计算 6 的 支配 集 的 算法 。 整 个 技 
术 就 是 设计 一 个 数据 结构 ， 人 允许 应 用 引 理 $. 12、5. 13 和 5.14 的 转化 有 效 地 找到 合适 的 边 。 

直观 地 ， 按 如 下 方式 为 给 定 的 有 向 无 环 图 G = (Y, 巨 ) 构 造 支配 树 。 首 先 ， 从 根 开始 执行 C 
的 深度 优先 搜索 ， 构 造 一 棵 深度 优先 生成 树 S$ = (Y，7) 。 根 据 其 深度 优先 数 ， 重 新 标记 C 的 顶 
点 。 然 后 ， 将 引 理 5.12 ~ $. 14 中 的 转化 应 用 于 C。 用 两 个 相互 关联 的 程序 实现 转化 ， 一 个 用 于 
处 理 前 向 边 ， 另 一 个 用 于 交叉 边 。 
|. 前 向 边 

假定 6 不 存在 交叉 边 。 如 果 顶 点 v 作为 多 于 一 条 前 向 边 的 头 端 ， 那 么 ， 由 引 理 5.12， 除 了 
边 屁 端 最 小 的 那 条 外 ， 所 有 以 4+ 为 头 的 前 向 边 都 可 以 删除 ， 而 不 会 改变 任意 顶点 的 支配 集 。 

组 合 边 (composite edge) 是 一 个 有 序 对 (:;， 日 ) ， 其 中 上 为 称 为 组 合 边 尾 的 顶点 ， 豆 为 组 合 边 头 
BOURSE. AAW(t, [hs h, 0, hy} RAW, hi), (G, h), on, G, 及) 的 集合 。 

重复 应 用 引 理 5. 12 改变 各 前 向 边 的 尾 端 。 有 时 ， 对 于 有 相同 尾 端的 边 集 合 中 的 每 条 边 ， 
其 尾 端 将 变 为 。 为 了 更 有 效 ， 用 一 条 组 合 边 表示 具有 共同 尾 端的 前 向 边 的 某 些 集合 。 初 始 时 ， 
每 条 前 向 边 (:，h) 用 组 合 边 (:，|h|} ) 表 示 。 . 

将 G 的 每 个 顶点 ov 关联 到 集合 F[v] 。F[v] 包 含 形 如 (t，|h，h,，…， hap AM, Mew 
的 祖先 ， 每 个 为 v 的 后 代 ， 并 且 (1，h) 为 6G 中 的 一 条 前 向 边 。 首 先 ，F[v] = (0, fol}, 其 
中 :为 以 v 为 头 的 一 条 前 向 边 的 最 小 深度 数 的 尾 端 。 

现在 ， 按 逆 先 序 遍历 生成 树 。 当 沿 着 生成 树 边 (v，w) 返 回 时 ， 发 现 对 于 w 的 每 个 确定 的 祖先 
t, RE F[w] 包 含 一 条 组 合 边 ,i 为 当前 w 的 后 代 的 一 条 前 向 边 的 尾 端 。 然 后 ， 执 行 下 述 操作 。 

1. H(t, fhi, ha, oo, A} lw) PAA, BERK. MBH, Il 
从 F[w] 中 删除 该 组 合 边 (组 合 边 表示 前 向 边 的 集合 ， 应 用 引 理 5. 12， 这 些 前 向 边 的 尾 端 已 经 位 
于 "之 前 ， 但 不 会 更 靠 前 ) 。 对 于 1<is<m， 从 G 中 删除 以 有 为 头 的 生成 树 边 (这 一 步 对 应 引 理 
5.13 的 应 用 ) 。 

2. d 6 中 存在 前 向 边 (;,v) ,2 则 对 于 使 得 wz>: 的 FEw] 中 的 每 条 组 合 边 (uw，{h，…, ht), 
做 如 下 操作 : 

a) Flw] PIRC, fhi, ons, hls 

bH lh, «e, hn) 与 代表 其 他 边 的 Ffv] 中 组 合 边 的 头 与 边 (1，v) 相 合并 。 

(该 步 相 应 于 引 理 5. 12 的 应 用 。) 

3. H Fiv] UF[w] 取 代 Flo]. 

例 5.15 考虑 图 5-31 所 示 的 带 根 有 向 无 环 图 C。 
对 6 进行 深度 优先 搜索 ， 生 成 图 5-32a 所 示 的 图 。 在 图 
中 也 给 出 了 与 每 个 顶点 相关 的 下 集合 。 图 5-32b ~ d 给 
出 了 前 向 边 处 理 的 结果 。 图 5-32d 中 是 最 后 得 到 的 支 
配 树 。 口 

当 到 达 根 的 时 候 得 到 的 图 是 正确 的 支配 树 (假定 没 
有 交叉 边 ) ， 这 和 留 给 读者 来 证 明 。 将 不 相交 集合 合并 算 
法 用 来 处 理 组 合 边 边 头 的 集合 ， 可 以 有 效 地 实现 该 算 BSS) 带 根 有 向 无 环 图 
法 。 由 于 必然 可 以 有 效 地 删除 一 条 组 合 边 ， 可 以 用 2-3 树 表示 由 组 合 边 组 成 的 集合 F[v] ， 使 得 
在 组 合 边 集 合 中 找到 拥有 最 大 深度 数 尾 端的 组 合 边 ， 得 到 组 合 边 集 合 的 并 。 用 这 样 的 数据 结构 
处 理 含 有 e 条 边 的 图 需要 的 时 间 为 O(eloge) 。 





O ”假定 除了 其 尾 端 深度 数 最 小 的 前 向 边 之 外 ， 已 经 从 C 中 删除 了 所 有 以 * 为 头 的 前 向 边 。 









ix \ (FDI -e 
/(2) 2 =0 \ 
K X 1F[2] =@ 
/l Sus = (0, (1) lf PN aca) 
(M ER Mon E 
Fla) = { (41) | (8) \ Fle] = (i2, (6))} \ 


Fla} = {(1, n) (4) (6) !rte = (2, (6, 7) 
(7 ) FD = (3,00) 
FI6) = {(2, (61) (8) 





c) 沿 着 生成 树 边 (3, 4 的 返回 状态 中 ) 沿 着 生成 树 边 (1,2) 的 返回 状态 


5-32 ”前 向 边 转 化 的 结果 


WI. 交叉 边 

一 般 地 ， 不 能 假定 不 存在 交叉 边 。 通 过 以 下 将 要 描述 的 方法 ， 可 以 用 前 向 边 取代 交叉 边 。 
然而 ， 由 于 在 了 中 为 了 有 效 地 应 用 引 理 5. 14 而 构建 了 数据 结构 ， 因 而 ， 在 如 7 那样 处 理 前 向 边 之 
前 ,不 应 该 做 这 种 取代 。 并 且 ， 由 于 去 除 的 每 条 交叉 边 都 将 变 为 一 条 前 向 边 ， 所 以 在 去 除 交 叉 边 
之 前 不 应 该 完全 地 执行 1, 应 该 在 关于 前 向 边 倒转 的 先 序 遍历 过 程 中 添加 交叉 边 的 处 理 步 。 注 
意 ， 由 于 使 用 了 引 理 5.13, 要 求 在 某 些 时 刻 ， 不 存在 指向 某 些 顶点 的 交叉 边 。 实 际 上 ， 用 下 面 
所 描绘 的 步骤 ， 按 反 先 序 进行 的 遍历 应 该 使 读者 相信 ， 在 交叉 边 的 存在 使 得 不 能 使 用 引 理 5. 13 
之 前 ， 每 条 交叉 边 都 将 已 经 改变 为 一 条 前 向 边 。 

设 5 为 6 的 深度 优先 生成 树 。 首 先 ， 对 于 每 条 交叉 边 (v，w) ， 计 算 ”和 vw 深度 数 最 大 的 共 
同 祖先 。 对 每 个 顶点 v， 使 其 对 应 由 有 序 对 (ww，w) 组 成 的 集合 L[v] ， 其 中 尺 >w，(wu，w) 表 示 对 
u 和 w 深度 数 较 高 祖先 的 一 次 请 求 。 初 始 时 ，L[v] = [(o, w) | 存在 交叉 边 (v, w), v» wl. Æ 
如 同 了 部 分 那样 遍历 5 时， 执行 下 述 操 作 。 

1. BRAO, w), v cw 时 ， 从 LEv] 中 删除 满足 yw 的 每 个 (x,，y)。 顶 点 v 为 x* 和 y 的 
具有 最 大 深度 数 的 共同 祖先 。 

2. 由 生成 树 边 (wv,w) 返 回 到 wv 的 时 候 ， 用 Lv] UL wB Lo]. 

通过 一 般 化 习题 4. 21 中 离线 MIN 算法 ， 可 以 在 至 多 0(eG(e) ) 步 内 计算 深度 数 最 大 的 祖先 ， 
其 中 ，e 为 6 中 的 边 数 。 

通过 应 用 引 理 5. 14 处 理 交叉 边 ， 将 其 转化 为 前 向 边 。 当 处 理 前 向 边 时 ， 必 须 将 交叉 边 转化 
到 前 向 边 。 对 于 每 个 顶点 "， 将 组 合 边 的 集合 C[v] RK. GERI, Clo] = 1(v, fh, +, hnl)! 
MF isi<m, (v, h)X-— 36311 。 当 通过 树 边 (*，2) 返 回 到 顶点 ”的 时 候 ， 除 了 处 理 前 向 
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边 的 步骤 之 外 ， 执 行 下 述 步 又。 

1. H Civ] UCL w] uS Cv]; 

2. 删除 交叉 边 (*，7y) ， 则 在 当前 表示 » 的 组 合 边 中 ," 为 * My 最 大 深度 数 的 祖先 。 如 果 组 
合 边 有 尾 端 :， 用 前 向 边 (:，y) 取代 交叉 边 (*，y) 。 如 果 已 经 存在 一 条 指向 y 的 前 向 边 ， 则 仅 保 
留 有 最 小 尾 端的 前 向 边 ; 

3. 如 果 存 在 的 话 ， 设 (uw, v) SUA v 为 头 的 前 向 边 。 否 则 ， 设 (u,v) 为 指向 v 的 树 边 。 在 查 
找 了 "的 所 有 后 代 之 后 ， 从 Co WREEF u 之 上 的 组 合 交叉 边 。 将 已 删除 的 组 合 交叉 边 的 
头 端的 集合 合并 在 一 起 ， 生 成 一 条 以 “为 尾 端 的 新 组 合 边 ， 将 其 添加 到 Clo]. 

例 5. 16 考虑 图 5-33a 所 示 的 深度 优先 生成 树 。 对 于 选 定 的 顶点 给 出 了 C[v] 值 。 由 于 存在 
一 条 从 顶点 2 指向 顶点 8 的 前 向 边 , 将 C[8] 中 的 组 合 边 (8，{141) 变 为 (2，|4| )。 然 后 ,将 
CL8] 合 并 到 CL7]。 由 于 (1，7) 为 一 条 前 向 边 ， 将 组 合 边 (2，141 ) 变 为 (1，{4} ) 。 当 回 到 6 时， 
C[6] 变 成 为 {(1, 141), (6, 15})}。 

当 从 顶点 6 回 到 项 点 3 时 ，C[3] 变 为 {(3，{51)，(1，{4| )|。 顶 点 3 为 顶点 6 和 5 以 及 顶 
点 8 和 4 的 最 大 深度 数 的 祖先 ， 因 此 ， 从 C[3] 中 删除 组 合 边 (3，{51 ) 和 (1，141 ) ， 并 将 前 向 边 
(3，5) 和 (1，4) 添加 到 C 中 。 结 果 如 图 533b 所 示 。 其 余 查 找 没有 引起 进一步 的 变化 。 口 





cl) =9 cll «6 
Ci2) -6 QAN cza- 
M 
Ci3) - e Nom 
cte! = (i6, (51) \ 
| 
j 
= l 
CI7] «9 j 
CI8] = {(8, (4))) 
a) 初 始 状态 b 在 考虑 了 边 (3,6) 之 后 的 状态 
图 5-33 ”删除 交叉 边 


可 以 用 2-3 树 表示 组 合 交 叉 边 ， 支 配 算法 的 正式 描述 作为 一 个 有 趣 的 习题 留 给 读者 。 如 果 能 
够 将 合适 的 数据 结构 组 合 起 来 ， 那 么 就 掌握 了 第 4 章 和 第 5 章 的 技术 。 


习题 


5.1 对 于 图 5-34 所 示 ， 假 定 所 给 出 的 边 是 无 向 的 ， 找 出 其 最 小 代价 生成 树 。 

5.2 设 S=(Y，7) 为 算法 5. 1 构造 的 一 棵 最 小 代价 生成 树 。7 中 各 条 边 的 代价 为 c xo Rex 
co 设 5' 为 任意 一 棵 生成 树 ， 其 各 边 的 代价 为 d ds xd, HR: 对 于 1<i<n，ci 
和。 

使 用 下 述 策略 ， 在 0(e) 时 间 内 为 有 个 顶点 和 e 条 边 的 图 找 出 一 棵 最 小 代价 生成 树 ,e。 和 
满足 ef(n)， 其 中 函数 须 由 你 给 出 。 在 各 个 时 刻 ， 将 顶点 分 组 为 集合 ， 并 将 这 些 集合 用 
目前 所 找到 的 树 边 连接 。 把 所 有 以 集合 中 1 或 2 个 顶点 为 人 射 点 的 边 保留 在 集合 的 优先 队 
列 中 。 初 始 时 ， 每 个 顶点 自身 位 于 一 个 集合 中 。 











5.4 


5.5 
5.6 
5.7 
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图 5-34 


和 迭代 步 是 为 了 找 出 最 小 集合 3S， 以 及 导出 S 的 最 小 代价 边 ， 假 定 为 集合 7。 然 后， 将 那 条 边 
加 到 生成 树 中 ， 合 并 集合 S 和 7T。 然 而 ， 如 果 所 有 的 集合 大 小 至 少 为 g(n)， 其 中 g 为 必须 
找 出 的 另 一 个 函数 ， 那 么 对 每 个 集合 用 一 个 项 点 构造 一 个 新 图 。 如 果 初 始 时 ，S, 中 的 某 个 
顶点 同 9: 中 的 某 个 顶点 是 邻接 的 ， 那 么 在 新 图 中 ， 与 集合 S 和 5, 相 关 的 顶点 是 邻接 的 。 新 
图 中 ,连接 5, 和 5, 边 的 代价 是 初始 时 5, 中 任意 顶点 和 5, 中 某 个 顶点 之 间 任 意 边 中 的 最 小 代 
价 。 然 后 ， 将 算法 递归 地 应 用 于 新 图 。 

需要 解决 的 问题 是 选择 (n), [818 f( n) Buh, 

为 图 5-35 中 的 无 向 图 找 出 深度 优先 生成 森林 。 对 于 每 棵 树 ， 随 意 选 择 初始 顶点 。 找 出 图 的 
双 连 通 分 支 。 





为 图 5-34 中 的 有 向 图 找 出 深度 优先 生成 森林 。 然 后 找 出 强 连 通 分 支 。 
为 图 5-36 找 出 双 连 通 分 支 。 

借助 深度 优先 搜索 设计 有 效 算 法 ， 实 现下 列 任务 : 

a) 将 无 向 图 分 解 为 其 连通 分 支 ; 

b) 在 一 个 无 向 连通 图 中 找到 一 条 路 径 ， 使 其 在 每 个 方向 
恰好 通过 每 条 边 一 次 ; 

c) 验 证 是 否 一 个 无 向 图 无 环 ; 

d) 为 一 个 无 环 有 向 图 中 的 顶点 找到 一 个 顺序 ， 如 果 存 在 
一 条 从 v A w 且 长 度 大 于 0 的 路 径 ， 则 v < w; 

e) 确 定 是 否 一 个 连通 无 向 图 的 边 可 以 有 向 化 ， 得 到 一 个 
强 连通 有 向 图 。[ 提示 : 证 明 目 标 当 且 仅 当 从 G 中 删除 
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任意 边 得 到 的 是 一 个 连通 图 时 才能 实现 。] 

WE G-(V, EE) 为 多 重 图 (multigraph)( 即 无 向 图 G 中 ， 每 对 顶点 之 间 不 止 有 一 条 边 ) 。 编 写 一 
个 OC | E || ) 算 法 删除 度 为 2 的 顶点 v[ 通 过 用 边 (wu，w) 取 代 边 (u,v) 和 (v，w)]， 并 用 一 条 
边 取 代 边 的 多 个 副本 。 注 意 ; 通过 一 条 边 取 代 边 的 多 个 副本 可 能 会 创建 度 为 2 的 顶点 ， 而 必 
须 删 除 这 类 顶点 。 相 似 地 ， 删 除 度 为 2 的 顶点 可 能 创建 多 重 边 ， 随 后 必须 删除 这 类 边 。 

无 向 图 的 欧 拉 回 路 是 一 条 路 径 ， 起 始 并 终止 于 相同 的 顶点 ， 并 且 经 过 每 条 边 恰好 一 次 。 一 
个 连通 无 向 图 C 包含 一 个 欧 拉 回 路 ， 当 且 仅 当 每 个 顶点 的 度数 都 为 偶数 。 给 出 一 个 O(e) 
算法 ， 在 包含 e 条 边 的 图 中 找 出 一 个 欧 拉 回路 ， 如 果 存 在 的 话 。 

设 C=(Y， E) 为 双 连 通 无 向 图 ，(v, w) 为 G 中 的 一 条 边 , GS (1o, wl, I, w)|)。 
找 出 一 种 技术 在 线 执行 形 如 FINDPATH (s, t) 的 指令 序列 ， 其 中 * 为 6' 的 一 个 顶点 ，(s， 
t) WE 6 中 而 不 在 6' 中 的 一 条 边 。FINDPATH(s, 41) 的 执行 包括 在 G 中 找到 一 条 起 始 于 边 
(s, t) ,终止 于 C' 中 的 顶点 而 不 是 : 的 简单 路 径 ， 并 且 将 路 径 中 的 顶点 和 边 加 入 C' 中 。 任 
何 序列 的 执行 时 间 都 应 该 为 0( || Ell). 

考虑 图 5-37 中 的 有 向 图 C。 

a) 找 出 G 的 传递 闭 包 。 

b) 找 出 C 中 每 对 顶点 间 最 短路 径 的 长 度 。 图 5-37 给 出 每 条 边 的 代价 。 

找 出 一 个 含有 4 个 元 素 的 闭 半 环 。 

有 向 图 C = (V，E) 的 传递 归 约 (transitive 
reduction ) 定义 为 边 数 尽 可 能 少 的 图 6' = 
(V, E'), ， 使 得 C' 的 传递 闭 包 等 价 于 CM 
传递 闭 包 。 WH: 如 果 6 无 环 ， 则 6 的 传 
递归 约 唯一 。 

EH: 当 ( 合 理 地 ) 假 定 8R(n) >R(2n) > 
4R(n) BH. 8T(n) 2 T(2n) zAT(n)BE[, 为 一 
An 顶点 的 无 环 图 计算 传递 妇 约 的 时 
间 R(n) 为 计算 传递 闭 包 的 时 间 T(n) 的 常 
量 因 子 。 

证 明 : 当 假设 同 习题 5. 14 时 ， 为 一 个 无 环 
图 计算 传递 归 约 所 需要 的 时 间 ， 对 任意 图 
找 出 其 传递 归 约 所 需要 时 间 的 常量 因子 。 
对 于 传递 闭 包 ， 证 明 习题 5. 15, 

设 4 为 闭 半 环 {0，1|} Ef nxn AREE, AR | 
使 用 图 形 化 解释 ， 证 明 下 述 结论 : 

a)A* =I,+A+A e AP | 


b» (5 a) ( e) 


A RÀ 





o c) "lo c 

提示 : 证 明 

A Bi A’ ACBACHBCa- + BC 
(o c) =(, C 


WEB]: 如 果 某 些 边 的 代价 为 负 ， 但 不 包含 代价 为 负 的 环 ， 则 5. 8 节 中 的 最 短路 径 算法 仍然 
适用 。 如 果 存 在 代价 为 负 的 环 ， 则 结果 会 怎样 ? 
证 明 : 含有 + ce 和 -om 的 正 负 实数 不 是 一 个 闭 半 环 。 在 此 条 件 下 ， 如 何 解 释 习 题 5. 18? 
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5. 20 
*5. 2] 


**5.22 


* 5.23 


* 5. 24 


5. 25 
5. 26 
5.27 


5. 28 


** 5. 20 


[提示 : 在 算法 5.5 中 实际 使 用 到 的 是 闭 半 环 的 什么 属性 ?] 

使 用 算法 5.6， 找 出 从 顶点 w 到 图 5-37 的 图 C 中 每 个 顶点 v 的 最 短 距 离 。 

HEAR: 对 于 包含 e 条 边 和 个 顶点 的 图 ， 可 以 在 0(elogn) 时 间 内 解决 非 负 边 的 单 源 最 短路 
径 问题 。[ 提示 : 使 用 合适 的 数据 结构 ， 当 e < cn NR, 可 以 有 效 地 执行 算法 5.6 的 第 
5 和 8 行 。] 

证 明 : 在 包含 e 条 边 和 n 个 顶点 的 图 中 ， 对 于 任意 固定 的 常数 上 ， 可 以 在 Oke + n! "Rf 
间 内 解决 非 负 边 的 单 源 最 短路 径 问 题 。 

证 明 : 对 于 含有 负 代价 边 而 不 包含 负 代价 环 的 任意 图 ， 可 以 用 图 5-38 中 的 单 源 最 短路 径 
算法 计算 从 wm 到 每 个 顶点 ”的 最 短路 径 。 


S = {ve}; 

D[vo] | 0; 

for cach v in V — {vg} de D[v] | l(v,, v); 
while 5 ¥ V do 


begin u 
choose a vertex w in V — 5 such that D[w] is a minimum; 


$S—SU(wk 
for v € V such that D[v] > D[w] + Kw, v) de 


D(v] = D[w] + I(w, v); 
Ses-iv) 





图 5-38 单 源 最 短路 径 算法 


对 于 图 5-38 中 的 算法 ， 其 执行 时 间 的 阶 是 多 少 ? [提示 : 在 一 个 包含 5 个 顶点 的 图 中 执行 
该 算法 ， 其 中 边 的 代价 如 图 5-39 所 示 。] 


U^ a ou)P NN 





图 5-39 一 个 5 顶点 图 边 的 代价 


给 出 一 个 算法 ， 确 定 对 于 含有 正和 负 代价 边 的 有 向 图 是 否 含有 代价 为 负 的 环 。 
在 图 5-38 的 算法 中 ， 改 变 w 的 选择 规则 ， 对 任意 代价 边 ， 保 证 时 间 界 为 O(n )。 
给 定 一 个 正 整数 的 nxn 矩阵 HM， 编写 一 个 算法 找 出 起 始 于 Mn, 1], 
终止 于 MM[1，n] 的 邻接 矩阵 元 序列 ， 使 得 邻接 矩阵 元 之 间 差 的 绝对 值 
之 和 最 小 。 如 果 (a)i=k+1 且 j=1，(b)i=k 且 j=L+1， 则 两 个 矩阵 
元 M[i, 加 和 M[k, 引 是 邻接 的 。 例 如 ， 在 图 5-40 中 , 序列 7，5，8， 
7, 9, 6, 12 为 一 种 解决 方案 。 

对 于 每 个 顶点 veV， 从 wv% 到 wv 的 所 有 路 径 P， 图 5-24 中 的 算法 计算 ”图 540 正 整 数 矩 阵 
路 径 己 代价 的 最 小 值 。 对 于 了 中 的 每 个 顶点 v， 修 改 算法 以 得 到 一 条 最 小 代价 的 路 径 。 
编写 一 个 程序 ， 实 现 $. 11 节 中 的 支配 集 算法 。 
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研究 性 问题 


5.30 存在 众多 图 问题 ， 必 然 有 一 些 应 用 深度 优先 搜索 技术 。 其 中 之 一 所 表示 的 是 关于 上 连通 性 
的 问题 。 对 于 无 向 图 中 的 每 对 顶点 v 和 w， 如 果 在 v M w 之 间 存 在 大 条 路 径 ， 使 得 (除了 ， 
和 w 外 ) 没 有 顶点 出 现在 一 条 以 上 路 径 上 ， 则 该 无 向 图 是 k 连通 的 。 因 此 ， 双 连通 指 的 是 
2 连通 的 。Hopcroft 和 Tarjan[ 1973b] 给 出 了 一 个 线性 时 间 算 法 找 出 3 连通 分 支 。 这 很 自然 
地 联想 到 ， 对 于 每 个 上 ， 存 在 线性 (在 大 量 顶 点 和 边 中 ) 时 间 算 法 找到 上 连通 分 支 。 你 能 够 
找到 一 个 吗 ? 

5.31 ”对 于 最 小 代价 生成 树 的 一 个 有 趣 期 望 是 设计 一 个 线性 ( 与 边 数 相关 ) 时间 的 算法 ， 可 以 涉 
及 也 可 以 不 涉及 深度 优先 搜索 技术 。 

5.32 值得 考虑 的 第 3 个 问题 是 当 e < <n MRP, FE 0(e) 算 法 来 找到 两 个 特 
定点 之 间 的 最 短 距离 吗 ? 读者 应 该 从 Johnson[ 1973] 中 了 解 到 习题 5.21 和 5$. 22 ， 也 应 该 从 
Spira 和 Pan[ 1973 ] 中 了 解 到 对 于 那些 仅 使 用 边 代 价 和 之 间 比 较 的 算法 ， 证 明 其 一 般 需 要 
n^/4 次 比较 。 在 边 的 权重 为 小 整数 的 情况 下 ，Wagner[ 1974 ] 使 用 桶 排序 技术 得 到 了 一 个 
0(e) 算 法 。 

5.33 已 经 证 明 ， 如 果 仅 允许 操作 MIN 和 + ， 则 找 出 所 有 点 对 之 间 最 短路 径 的 问题 需要 kn’ 2b , 
其 中 常数 上 >0(Kerr，[ 1972] ) M. O. Rabin 将 这 一 结果 精 化 为 m/6。 然 而 ， 如 果 人 允许 其 
他 操作 ， 可 能 我 们 能 够 做 得 比 0(n ) 更 好 。 例 如 ， 如 果 使 用 布尔 操作 之 外 的 其 他 操作 ， 可 
以 在 少 于 Om ) 步 内 完成 传递 闭 包 ( 等 价 地 ， 布 尔 矩 阵 乘法 ) ， 下 一 章 将 看 到 这 类 结果 。 


文献 与 注释 


与 图 论 相关 的 两 种 资源 为 Berge[ 1958 ] 和 Harary[ 1969] 。 关 于 最 小 代价 生成 树 的 算法 5. 1 来 
自 Kruskal[ 1956] Prim[ 1957 ] 给 出 了 该 问题 的 另 一 种 方法 。P. M. Spira 提供 了 习题 5. 3 FERK 
算法 。 

使 用 深度 优先 搜索 的 双 连 通 性 算法 由 J. E. Hopcroft 提出 。 而 强 连通 分 支 算 法 则 来 自 Tarjan 
[1972 ] 。 在 文献 中 ,许多 应 用 通过 使 用 深度 优先 搜索 为 已 知 算法 得 到 优化 。Hoperoft 和 Tarjan 
[1973a] 给 出 一 个 线性 的 平面 测试 算法 。Hopcroft 和 Tarjan[ 1973b ] 描述 了 一 个 3 连通 分 支 的 线性 
算法 。Tarjan[ 1973a ] 利用 这 种 概念 得 到 了 目前 为 止 找 出 支配 集 的 最 优 算法 ， 并 且 Tarjan[ 1973b ] 
给 出 了 一 个 “ 流 图 可 归 约 性 ”的 测试 算法 。 

作为 通用 的 路 径 查 找 算 法 ， 算 法 5.5 基本 上 归功 于 Kleene[ 1956], ， 他 将 其 同 “ 正 则 表达 式 ” 
(参见 9. 1 节 ) 联 系 起 来 。 这 里 所 给 出 的 算法 形式 来 源 于 McNaughton 和 Yamada[ 1960], O(n?) t 
传递 闭 包 算法 归功 于 Warshall[1962]. 。 相 似 地 ， 所 有 点 对 的 最 短路 径 算法 来 自 Floyd[ 1962]。( 也 
见 Hu[ 1968]) ) Dijkstra[ 1959 ] 提出 了 单 源 算法 。Spira 和 Pan[ 1973 ] 证 明了 在 决策 树 模 型 下 ，Di- 
jkstra 算法 必定 是 优 的 。 

在 Dantzig、Blattner 和 Rao[ 1967 ] 中 研究 发 现 ， 如 果 不 存在 负 环 ， 则 负 边 的 存在 不 会 影响 所 
有 点 的 最 短路 径 问 题 。Johnson[ 1973 ] 讨 论 了 含有 负 边 的 单 源 问 题 ， 在 其 中 可 以 找到 习题 5. 21 和 
5.22 的 解答 。 为 了 找到 最 短路 径 ，Spira[ 1973] 给 出 了 一 个 O(n’ log n) 的 期 望 时 间 算 法 。 

路 径 问题 和 先 阵 乘法 问题 之 间 的 关系 源 自 Munro[ 1971 ] 和 Furman[ 1970] (定理 5.7) ， 以 及 
Fischer 和 Meyer[ 1971] (定理 5.6) 。 与 传递 归 约 有 关 的 关系 (习题 5.13 ~5.15)3€ Á Aho, Garey 
和 Ullman[ 1972] 。Even[ 1973 ] 讨 论 了 图 的 大 连通 性 问题 。 
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第 6 m ”矩阵 乘法 及 相关 操作 


本 章 研 究 元 素 取 自任 意 环 的 矩阵 乘法 的 渐 近 计算 复杂 度 。 我 们 将 看 到 “普通 "0(m ) JE ERR 
法 算法 是 可 以 渐 近 改进 的 ，0(””) 的 复杂 度 足 以 解决 两 个 ”xz 矩阵 的 乘法 运算 。 同 时 ， 本 章 还 
将 研究 可 以 转化 为 矩阵 乘法 的 其 他 运算 ， 比 如 LUP 分 解 、 和 矩阵 求 道 、 行 列 式 计算 等 ， 它 们 与 矩 
阵 乘法 同 阶 。 可 以 看 到 ， 握 阵 乘法 可 以 转化 为 矩阵 求 逆 运 算 ， 因 此 ， 这 两 种 运算 中 的 一 种 的 渐 近 
时 间 提 高 都 将 改善 另 一 种 运算 。 最 后 ， 本 章 以 两 个 低 于 O(n^ ) 渐 近 时 间 复 杂 度 的 布尔 矩阵 乘法 算 

对 于 本 章 所 描述 的 大 规模 算法 ， 目 前 的 计算 机 硬件 实际 情况 难以 满足 。 首 先 ， 由 于 潜在 的 
常数 因子 ,需要 足够 大 的 4 值 才能 使 算法 真正 浙 近 优 于 普通 的 0(m ) 。 其 次 ， 对 这 类 算法 的 数值 
误差 的 控制 目前 还 没有 深入 的 理解 。 但 是 ， 通 过 本 章 内 容 的 学 习 ， 在 处 理 此 类 算法 问题 时 ， 读 者 
可 以 认识 到 平时 显而易见 的 算法 并 不 一 定 是 最 优 的 ， 寻 找 更 有 效 或 更 切实 际 的 算法 来 解决 这 类 
问题 总 是 需要 的 。 


6.1 基础 知识 


本 节 主 要 给 出 矩阵 乘法 所 涉及 到 的 代数 概念 的 基本 定义 。 如 果 读 者 对 环 及 线性 代数 知识 比 
较 熟悉 ， 可 以 直接 进入 6.2 节 。 

定义 ” 环 是 代数 结构 (S，+ ，，,，0,1)，, 其 中 S 是 元 素 的 集合 ，+ 和， 分别 是 集合 S 的 二 
元 操作 。S 中 的 任意 元 素 a, b 和 c 满足 以 下 性 质 :、 


l.(a*b) +c=a+(b+c) (a+b) .c=a. (bsc) (+ 和 .符合 结合 律 ) 
2.a+b=b+a (+ 符合 交换 律 ) 
3.(a*b) -c=a+c+b+cHa: (btc) =a*btasc (， 对 + 符合 分 配 律 ) 
4.a+0=0+a=a (0 是 + 的 单位 元 ) 
5.a*1z21-*:a-2a (1 是， 的 单位 元 ) 


6. 对 于 S 中 的 任意 元 素 4， 存 在 送 -a, 使 得 a+( -a)=(-a)+ta=0 

注意 ， 在 上 述 最 后 一 个 属性 中 ， 加 法 逆 的 存在 不 一 定 适用 于 任意 的 闲 半 环 ( 见 5.6 节 )。 同 
样 ， 闭 半 环 的 第 4 条 性 质 即 无 限 和 存在 且 值 叭 一， 也 不 总 是 适合 于 环 。 如 果 “' 符合 交换 律 ， 则 该 
环 称 为 交换 环 。 

如 果 在 交换 环 中 ， 任 意 元 素 a FERE a, 使 得 a。. a =a .ao=1， 则 该 环 为 域 。 

例 6. 1 基于 普通 加 法 + 和 乘法 的 实数 集 形 成 环 ， 但 不 形成 闭 半 环 。 

RAIO, 1}, +, -,0, 1), Eh + ER? 的 加 法 运算 ，“' 是 普通 的 乘法 运算 ， 形 成 环 ， 
但 不 是 闭 半 环 ， 因 为 1+1+… 没 有 按照 半 环 的 性 质 进行 良 定义 。 如 果 + 重新 定义 如 下 : 如 果 a 
Alb 0, 则 ct+8 是 0; 否则 a+6 是 1。 在 这 种 情况 下 ， 产 生 例 5.1 的 闭 半 环 5,。5, RER, A 
为 1 Wu. 口 

下 面 的 定义 及 引 理 中 将 介绍 一 类 重要 的 由 矩阵 生成 的 环 。 

定义 BGER-(S, +, 5.0, DR, M, XX EB RE nxn BEARS, 0, X nxn 


O 这 里 采用 4[i j] SCORE MB LGB I 列 的 元 素 。 
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HEB, LXI nxn 的 单位 矩阵 ， 其 主 对 角 线 元 素 为 1， 其 他 为 0。 对 于 M, PERERA HB, 
设 A4+,B 为 nxn 的 矩阵 C， 其 中 C[i, j] =A[i, j] +BLi, 门 ? ,A4…,B 为 nxn 的 矩阵 DD， 其 中 
Dli, j) =E ALi, k] - Blk, Je 

5186.1 (M,, +,, » 1) RH. 

证 明 : 基本 练习 。 口 

注意 ， 尽 管 在 基础 环 R 中 乘法 运算 符合 交换 律 ， 但 上 面 定 义 的 矩阵 乘法 运算 ,在 nm>1I 时 
不 符合 交换 律 。 然 而 ， 在 不 引起 混淆 的 情况 下 ， 我 们 将 用 基础 环 中 的 加 法 和 乘法 运算 符号 + 和， 
来 代替 +, 和， ,， 另 外 ， 经 常 略 去 明显 存在 的 乘法 运算 符号 。 

BERIA, M, 为 nxn 和 矩阵 环 ， 其 中 矩阵 里 的 元 素来 自 R。 假定 4 是 侦 数 ， 则 在 M, 中 的 
n x n 矩阵 可 以 分 成 4 个 (mw2) x (n/2) 和 矩阵 。 假 定 Rw 为 2x2 BREST, 矩阵 里 的 元 素来 自 M0 
可 以 明显 看 出 ， 在 M, 中 的 nxn 矩阵 乘法 及 加 法 运算 与 Rs 中 的 2x2 矩阵 的 乘法 及 加 法 运算 分 
别 是 等 价 的 ， 其 中 2 x2 和 矩 阵 的 元 素 为 (n/2) x (n/2) 和 矩阵 。 

引 理 6.2 假定 /为 M, BR, ABH, HBA) R, a PHP RH: 

Ay An 
»n “| 

其 中 4, 为 4 的 左上 1/4 RR, A, 为 4 的 右上 1/4 BR, A 为 4 的 左下 1/4 SR, A 为 4 的 
右 下 1/4 象限 。 有 以 下 性 质 : 

i)f(A +B) =f(A) +f(B) 

ii)f( AB) =f(A) + f(B) 

证 明 : DAR, PM +A ERM, PA + A 定义 的 基本 练习 。 口 

引 理 6. 2 的 重要 性 在 于 能 够 通过 2 x2 及 (n/2) x (n/2) 的 矩阵 乘法 算法 来 构造 mxz 矩阵 的 
乘法 算法 。 在 下 一 节 中 将 通过 这 种 方法 构造 渐 近 更 快速 的 矩阵 乘法 算法 。 在 这 里 需要 注意 的 是 
这 里 的 2 x2 矩阵 乘法 不 是 任意 的 2 阶 方 阵 的 乘法 ， 而 是 针对 R, ,专门 设计 的 矩阵 乘法 。 因 为 
R, 中 的 乘法 并 不 要 求 满足 交换 律 ， 即 使 尺 满 足 ，2 x2 的 矩阵 乘法 算法 也 不 能 假定 (mw2) x (n/ 
2) 乘 法 操作 符合 交换 律 。 当 然 ， 可 以 使 用 环 的 任何 性 质 。 

定义 假定 4 为 符 阵 元 素来 自 某 个 域 的 有 xz 矩阵， 如 果 存 在 4 的 递 ， 记 为 4 ， 使 得 
44 =I Rr, NI A E n xn EE, 

TUAH, WEA HE, RAME—, HA = 4-14 SIL 成 立 ; MEA (AB) =B 4 
成 立 。 

定义 ”假定 4 为 任意 的 nxn 算 阵 ，Ah 的 行列 式 表 示 为 det(4) ， 是 下 列 积 的 整数 1 - n 的 所 有 
排列 p= (i, h, cns, i) BAL 


= 1)* TIU) 


Kp, WR p 是 偶 排 列 ,，[ 从 (1，2，…， n) 能 够 偶数 次 交换 ] 则 为 0; MR pA, 
[从 (1，2,，…,n) 通 过 奇数 次 交换 得 到 ] 则 此 为 1。 
很 容易 证 明 ， 一 个 排列 是 偶 排列 ， 或 者 是 奇 排列 ， 但 不 会 两 者 都 是 。 


例 6.2 4 
Gy, ân Og 
ay ay M 
a, 05 ay 


1, 2, 3 的 6 个 排列 为 (1， 2, 3), (1, 3, 2), (2, l, 3), (2, 3, 1), (3, l, 2) 和 (3， 
2，1)。(1，2，3) 是 侦 排 列 ， 因 为 它 只 需要 交换 0 次 就 能 实现 。 排 列 (2，3，1 ) 也 是 偶 排列 ， 因 


A= 
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为 可 以 先 从 (1，2，3 ) 开 始 交换 2 和 3 的 位 置 得 到 (1，3，2)， 然 后 再 交换 1 和 2 得 到 (2，3， 
1)。 类 似 地 ，(3，1，2) 是 偶 排 列 ， 其 他 3 个 排列 为 奇 排列 ， 可 得 

det(A) 24,0505 — 6,0505 - 050505 + ananay + 05050, -asdna 口 

假定 4 为 元 素来 自 某 个 域 的 n xn 矩阵， 证明 A” REHN det(4) #0, Fit, det(AB) 
=det(A)det(B), W det(A) 关 0， 称 矩阵 4 为 非 奇异 阵 。 ` 

定义 mxni&E A SS EE REM, WRU FER l<j<i<m, Ali, j] 50, mxn Æ 
阵 4 称 为 下 三 角 和 矩阵 ， 如 果 对 于 任意 的 1<i<j<n， 有 4[i， j] =0, 

两 个 上 三 角 和 矩阵 的 积 还 是 上 三 角 和 矩阵 ， 同 样 两 个 下 三 角 和 矩阵 的 乘法 运算 结果 也 是 下 三 角 
和 矩阵。 

引 理 6.3 如 果 4 是 上 三 角 或 下 三 角 符 阵 ， 则 

a) det( A) 为 矩阵 主 对 角 元 素 的 乘积 ( 即 IL4[i， il); 

b)A 是 非 奇 异 矩阵 当 且 仅 当主 对 角 线 上 没有 0 元 素 。 

证 明 :(a) 除 (1，2,…，n) 之 外 的 任意 排列 (i ，i,，…， i) 至少 存在 两 个 数 Mi, HE 
<j 且 i >k， 因 此 ，det(4) 中 的 所 有 项 都 是 0， 除 了 排列 (1，2，…，n) 所 对 应 的 项 ; (b) Hla) 
直接 得 证 。 口 

定义 ”单位 矩阵 (unit matrix) 是 主 对 角 线 元 素 全 是 1 的 矩阵 ( 非 主 对 角 线 元 素 值 任意 ) 。 

由 观察 可 知 ， 单 位 上 三 角 和 矩阵 和 单位 下 三 角 矩 阵 的 行列 式 是 单位 矩阵 。 

定义 如果 在 矩阵 中 ， 任 意 一 行 或 者 一 列 都 有 且 仅 有 一 个 1， 其 他 元 素 为 0， 则 称 为 置换 阵 。 

定义 在 矩阵 4 中 删除 某 些 行 和 某 些 列 后 所 剩 下 的 矩阵 称 为 4 的 子 阵 。m xz 和 矩阵 4 的 主子 
MAMA 的 前 大 行 和 前 天 列 构成 的 方 子 阵 ， 其 中 1 和 大 no 

ERE A 的 秩 记 为 rank(4) , RANGA 4 的 最 大 非 奇异 方 子 阵 的 大 小 。 例 如 nxn 置换 阵 的 秩 
为 n。 . 

观察 4= BC 的 情况 ， 满 足 rank(A) <MIN(rank(B), rank(C)), MRAAmMH, 且 它 的 秩 
为 m， 则 任意 从 A 中 取 & 行 所 形成 的 矩阵 的 秩 为 。 

定义 ”矩阵 4 的 转 置 记 为 4 ,是 通过 对 所 有 的 i 和 j 交换 4[i, 门 和 A[j, 让 的 位 置 形成 的 
EE, 


6.2 Strassen 矩阵 乘法 算法 


假设 4 A BAAS nxn eM, Jh ny 2 AOE, 3B SESIBRO.2, WERE A 和 8B 进行 划分 ， 
每 个 矩阵 里 面 划分 成 4 个 (n/2) x (n/2) 的 矩阵 ， 用 这 些 (n/2) x (n/2) 的 矩阵 表示 4 A B 的 积 为 


以 下 形式 : 
[^ "ly 7] - [7 M 
A, AyILB, By C, C, 


C, =AuB + A5B,, 


其 中 


Cu =A,,B,, +A,,B, (6-1) 
C5 2 A4B,, +AyB,, 
Cy =42Bi +42B2 
如 果 把 4 和 了 看 成 2x2 和 矩阵， 矩阵 的 每 个 元 素 为 (mwX2) x (n2) BR, BRA REA 
和 B 的 乘法 结果 可 以 按照 式 (6-1) 表 示 的 (n/2) x (n/2) 个 矩阵 的 和 与 积 进行 计算 。 假 定 
计算 CEE (n/2) x (n/2) 和 矩阵 的 m 次 乘法 操作 和 a 次 加 (或 碱 法 ) 操 作 。 采 用 递归 算法 ， 
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可 以 在 T(n) 时 间 内 计算 两 个 nxn 和 矩阵 的 乘法 ， 其 中 4 是 2 BE, 则 7T(n) 满 足以 下 不 
FA: 


2 
Tn) smt) n>2 (6-2) 


在 式 (6-2) 右 边 的 第 一 项 为 进行 m 对 (n/2) x (/2) RRR, 38 — UR ETT a 
次 加 法 所 需要 的 代价 ， 假 定 n'/4 为 每 对 (n/2) x (n/2) 和 矩阵 进行 加 或 碱 运算 所 需要 的 时 间 。 通 过 
与 定理 2. 1 类 似 的 分 析 方 法 ， 在 c =2 的 情况 下 ， 可 以 证 明 只 要 m >4， 存 在 常数 上 ， 式 (6-2) 的 解 
的 上 限 为 tn"”"。 解 的 形式 不 受 a 的 影响 。 在 m «8 的 情况 下 ， 可 以 得 到 渐 近 复杂 度 优 于 普 
i O(n’) HR. 

V. Strassen 发 现 了 一 个 只 采用 7 次 乘法 运算 就 能 计算 出 两 个 2 x2 矩阵 的 乘积 的 巧妙 算法 ， 
和 矩阵 的 元 素来 自任 意 的 环 。 通 过 递归 使 用 该 方法 ,可 以 在 0(m™) 时 间 内 完成 两 个 nxn 的 矩阵 
乘法 ， 阶 大 约 在 m “左右 。 

引 理 6.4 两 个 2 x2 矩阵 的 乘法 可 以 通过 7 次 乘法 运算 和 18 次 加 / 减 运算 得 到 结果 ， 其 中 
和 矩阵 的 元 素 选 自任 意 环 。 

证 明 : 计算 以 下 矩阵 的 乘法 


[aie ie 
Cy Cy 7 44, GyJlb, b, 
m, z(a,-a4)(b, + b,) 
=(a,, ta,) (b,, *b,) 
m, = (a, - a4) (b, * b.) 

m, = (4a,, +4, ) by 


m, 2a, (5, ~b,) 


me = üy (b, - b.) 


首先 计算 以 下 积 。 


m, = (a, +ay)b, 
然后 采用 以 下 公式 计算 : 
Cl =m, +m, —m, +m, 
Cy =m, +m; 
ca = mg +m, 
Cy =m, - m, +m, - m, 
计算 次 数 是 显然 的 。 而 所 期 望 的 cy 值 的 证 明 是 基于 环 的 定律 的 简单 代数 练习 。 
习题 6. 5 给 出 了 一 种 只 需要 7 次 乘法 和 15 次 加 法 运算 就 可 计算 两 个 2 x 2 KERE 
的 方法 。 
定理 6.1 METER AERAH AR nxn 人 算 阵 乘法 运算 可 以 在 O(n”) 内 完成 。 
证 明 : BH, SR n=2 的 情况 ， 令 T(n) 为 两 个 nxn 和 矩阵 相 乘 所 需 的 算术 操作 次 数 。 运 用 
引 理 6. 4 可 得 ， 


T(n) =71( > ) +18(> zy 对 于 n>2 


因此 ， 通 过 简单 修改 定理 2.1， 可 得 T(n) 为 0(7”) 或 O(n”)。 
在 n 不 是 2 的 短 的 情况 下 ， 可 以 把 该 矩阵 嵌 人 到 维 数 最 小 的 比 2 的 需 更 高 的 矩阵 中 。 在 这 种 
情况 下 ， 和 矩阵 的 维 至 多 增加 一 倍 ， 因 此 ， 常 数 因子 至 多 增加 7。 因 此 ， 对 所 有 nS 的 情况 ， 
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T(n) X5 O(n™ ) RE. 

定理 6. 1 只 考虑 T(n) 的 函数 增长 率 。 但 要 确定 IR PTR Strassen 算法 的 性 能 优 于 普通 的 和 
法 ， 则 必须 确定 比例 常数 的 值 。 因 此 ,在 不 是 2 的 赛 的 情况 下 ， 仅 把 矩阵 嵌入 到 维 数 最 小 的 比 
2 的 指数 寡 更 高 的 矩阵 中 将 会 产生 一 个 大 的 常数 。 在 这 里 把 矩阵 散人 到 维 为 2"r 的 矩阵 中 ， 其 中 
为 适当 小 的 值 ， 运 用 p 次 引 理 6.4， 采 用 OCTO 的 算法 计算 两 个 rxr 和 矩阵 的 乘法 。 因 此 ， 可 以 提 
出 更 为 通用 的 递归 算法 ， 当 n 为 偶数 时 ， 像 前 面 一 样 ， 把 每 个 矩阵 划分 成 四 个 子 和 矩阵 ， 当 m 为 奇 
数 时 ， 先 把 维 数 增加 1 ， 然 后 采用 上 述 算法 。 

需要 指出 ， 确 定 比例 常数 仅 涉及 到 算术 运算 的 次 数 。 要 比较 Strassen 算法 与 普通 的 矩阵 乘法 
算法 ， 还 需 考虑 访问 矩阵 元 素 所 需 的 额外 复杂 度 。 


6.3 和 矩阵 求 逆 


在 这 节 中 ， 将 说 明 一 类 和 拖 阵 求 北 运 算 可 以 简化 为 矩阵 乘法 的 问题 。 这 类 和 矩阵 包括 所 有 可 以 
求 逆 的 三 角 和 矩阵 ， 但 不 包含 所 有 的 可 逆 和 矩阵 。 在 后 面 ， 将 把 该 方法 推广 到 任意 的 可 逆 和 矩阵。 在 本 
节 和 6.4、6.5 节 中 ， 假 定 所 有 和 抢 阵 的 元 素 选 自 某 个 域 。 

引 理 6.5 假设 矩阵 4 划分 如 下 : 


Au Ay 
np 
BRAE. ÆA =A -AA As, BBEA "fede, W 
Ave [^ +A; AA A, t] (63) 
-A'A AG A” 
证 明 : 通过 直接 的 算术 操作 可 以 直接 得 到 
4714 
ZI ME [ "le Allo yi 
其 中 4=4。 -A AGAn, DB 
I ~Aj'ApirAn' 0 I 0 
^o lo albo d 
[A 54424 ai T] 4 
-A'A AÑ A` 


引 理 6. 5 并 不 适合 所 有 的 非 奇异 矩阵 。 例 如 ，n xn BRER A 的 元 素 4[i, j]Æj=n-i+1 
时 ， 等 于 1; 否则 等 于 0， 和 矩阵 4 是 个 非 奇 异 挎 阵 ， 但 对 于 任意 主子 阵 4, ， 行 列 式 det(A) =0。 
引 理 6. 5 适合 所 有 的 非 奇 异 上 三 角 或 者 下 三 角 和 矩阵 。 

引 理 6.6 MRA 为 非 奇 异 的 上 (下 ) 三 角 和 矩阵 ， 则 引 理 6. 5 中 的 矩阵 4 和 4 RM, EAE 
阵 为 非 奇异 的 上 (下 ) ZAER. 

证 明 : 假定 4 为 上 三 角 和 矩阵 。 下 三 角 抢 阵 的 证 明 方 法 类 似 。 显 然 ，4,, 为 非 奇异 的 上 三 角 气 
BE, BEA 存在。 观察 可 得 A, =0， 因 此 4 S As - 444i'41, An, WHA 为 非 奇 异 的 上 三 角 矩 
阵 。 o 

定理 6.2 4 M(n) X 96 LB AR nx n A ER RE EPI REIR, 假设 对 所 有 的 m, 
8M(m) ZM(2m) 24M(m) KY, Rid — ^ Wdke, EREE nxn WETA) AER 
4 的 逆 可 以 在 cM(n) 时 间 内 计算 。 

证 明 : 这 里 只 证 明 n 是 2 的 者 的 情况 。 很 显然 ,在 "不 是 2 的 吞 的 情况 下 可 以 把 矩阵 4 嵌入 
到 如 下 形式 的 矩阵 中 : 
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[^ 0 
0 1, 
Et, m +ns2n 为 2 的 午 。 通 过 增加 常数 c， 使 之 至 多 为 8 的 因子 ， 这 个 结论 可 以 适合 任意 
的 n,? 

假定 m 是 2 的 者， 可 以 把 矩阵 4 划分 成 4 个 (n/2) x (nr2) 子 和 矩阵， 递归 地 使 用 式 (6-3) 。42 
=0， 所 以 4=42>。 因 此 ， 需 要 27(n/2) 时 间 求 三 角 和 矩阵 4, 和 4 的 逆 ，2M(n/2) 时 间 用 于 两 个 非 
平凡 阵 的 乘法 ，m/4 时 间 用 于 右上 三 角 矩 阵 的 求 反 运 算 。 从 定理 假定 及 观察 MCI) 21, A 74 
<M(n/2), WE 

T(1) 21 


T(n) <27( 3) +3M( 3) X T a22 (64) 
TEAR. (6-4) BR T(n) «3M(n)/2 是 个 比较 基础 的 练习 。 口 
6.4 SERRI LUP 分 解 
LUP 分 解 是 求解 线性 方程 组 的 有 效 方法 。 - 


EX ”对 于 mn 的 mxn 算 阵 4， 可 分 解 成 一 对 矩阵 虐 和 UU, IS A-LU, EPL Emxm 
ABER EREM, Ue mxn Lage, LAURA A 的 ZU 分解。 

可 以 解 方程 4x=b， 求 X， 其 中 4 为 mxpnm 和 矩阵 ，X 为 二 维 的 未 知 列 向 量 ，b An 
列 向 量 ， 把 矩阵 4 分 解 成 单位 下 三 角 矩 阵 了 上 和 上 三 角 和 抢 阵 尽 的 乘积 ， 假 定 这 两 个 因 式 
存在 。 则 方程 4x=b 可 以 写 为 LUX=b。 为 了 解 x， 可 以 先 解 Ly=b, RH y, 然后 由 
Ux = y Æ Hi x. 

该 方法 难点 在 于 矩阵 4 可 能 不 存在 LU 分 解 ， 即 使 4 为 非 奇 异 矩 阵 ， 如 矩阵 : 

0 1 
[5 o 

为 非 奇异 矩阵 ， 却 没有 LU 分 解 。 如 果 4 为 非 奇 异 和 矩阵 ， 则 存在 置换 矩阵 了， 使 得 AP HE 
LU 分 解 。 在 此 给 出 一 种 算法 ， 对 于 任意 非 奇 异 和 矩阵 4， 和 寻找 因 式 上 ,，U 和 P, 使 得 4 = LUP。 58 
BE L, U 和 P 称 为 矩阵 4 的 LUP 分 解 。 

算法 6.1 LUP 分 解 。 

输入 : nxn tka RRM, Rn 2 BE, 

输出 : BREL, URP, W M -LUP, RPL AM FEAR, UN LEAR, PHE 
REF. 

方法 : 调用 FACTOR(M, a, n), FACTOR 为 图 6-4 所 示 的 递归 过 程 。FACTOR 的 算法 过 程 
如 图 6-1、6-2 和 6-3 所 示 ， 在 图 中 ， 和 矩阵 的 阴影 部 分 表示 其 中 的 元 素 全 部 为 0。 





图 6-1 FACTOR 的 期 望 结果 


日” 进一步 的 分 析 可 得 到 适合 任意 载 数 = 的 常数 "<， 但 与 只 是 2 的 竹 的 情况 所 得 到 的 最 好 结果 有 较 大 的 区 别 。 
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b) 第 一 次 调用 FACTOR 后 4 的 因 式 


m2 p-mf2 
Rest of U, 


Rest of D 





c)U, 和 D 的 划分 


p mi? mh 









m/2 m2 È 
m = . p 
mi2 mh B 
d)D 左 下 角 的 零 处 理 
图 6-2 FACTOR 过 程 的 步骤 
p mí2 
mi2 
p - 


p-m? : 


a) MRP, 
m2 mh 





c) WA P 
图 6-3 FACTOR 完整 过 程 
OQ 了 可 以 当 作 单 位 下 (或 上 ) ZAE, 
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procedure FACTOR (A, m, p); 
if m =1 then 
begin 
& L=([1)( in, 工 是 单位 1 xi 矩阵) ; 
如 果 可 能 ， 选 取 4 中 具有 非 零 元 素 的 一 列 。e， 同 时 ， OPA pxp 置换 阵 ， 交 换 列 1 和 列 c; 
comment it. 已 = 已 -1; 
4 U=AP; 
return( LZ, U, P) 


采用 图 62a 所 示 方 法 划分 4 为 (m/2) xp WER B A C; 

调用 FACTOR(B,m/2, p) EL, U, Pi; 

HOE D-CPj!; 

comment 在 这 里 ，4 可 以 写成 如 图 6-2b 所 示 的 三 个 矩阵 的 乘法 ; 

令 E 和 FF 分 别 为 如 图 6-2c 所 示 的 和 DD 的 前 m/2 列 ; 

计算 c-D-FE^U,; 

comment 注意 : 和 矩阵 C 的 前 m/2 列 全 为 0。4 可 以 写成 如 图 6-2d 所 示 的 矩阵 乘法 结果 ; 

令 C 为 6 中 最 右 的 P-m/2 列 ; 

调用 FACTOR(G', m/2, p-m/2)f?E L, U, Po; 

4 PX pxp ERER, JUPLAKZ ER, P; 为 其 右 下 角 ， 如 图 63a MR; 

WX H-UP;!; 

comment 这 时 由 和 矩阵 Vi 和 6G 组 成 的 矩阵 可 以 表示 为 图 6-3b Bra, RA 6-3b 的 右边 为 图 6-2d4， 从 而 4 
表示 为 5 个 矩阵 的 乘积 。 其 中 前 两 个 矩阵 为 单位 下 三 角 抢 阵 ， 第 三 个 为 上 三 角 抢 阵 ， 后 而 两 个 
抢 阵 为 置换 矩阵 。 通 过 求 得 前 两 个 矩阵 乘积 ， 再 求 后 两 个 矩阵 的 乘积 得 到 和 矩阵 A 所 期 望 的 分 解 ; 

SLAB L, Onz, FE'M LAR mx mE, mE 6-3e 所 示 ; 

4UX mxpiBEE, E. H ABE E2EBSA E, Ona MUA FERS, WE 6-3e 所 示 ; 

4 PS PsP, RB; 

return(L, U, P); 

end 





图 64 ijf FACTOR 


每 次 递归 调用 FACTOR HEER nxn ERE M 的 mxp 子 阵 4 进 行 操作 。 每 次 调用 普 为 2 的 
E, AP m<p<n, MUARAWMA 6-1 所 示 的 矩阵 上 L，D 和 P, 口 
例 6.3 求 下 述 矩 阵 的 LUP 分 解 


wo o 
on oOo 
oO © m 


4000 
作为 开始 ， 调 用 FACTOR(M，4，4) ， 则 调用 如 下 过 程 
0001 
FACTOR{ ] 2, 4 
0020 
令 该 矩阵 为 4， 调 用 FACTOR([0 0 0 1], 1, 4), 返回 结果 如 下 : 
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0001 
0100 
L-[1] U,={1 0 0 OJĦP,= 0010 
1000 
交换 第 1 列 和 第 4 列 的 位 置 。 
在 算法 第 7 行 ， 计 算 
0 0 0 17° 
ac 01 0 0] _ 
D=CP; =[0 0 2 Ol 5 1 9 =[0 0 2 0] 
1000 


在 算法 第 8 行 , E-[1] fn F-[0], ， 所 以 在 第 9 行 6=D=[0 0 2 0), 在 第 10 行 , 可 得 
c =[0 2 0], 所 以 在 第 11 行 得 到 如 下 


010 
Lz[1] U,=[2 0 mn 0 | 
001 
下 一 步 ， 在 算法 第 12 行 


1000 
p.9910 
[010 0 
0001 
在 第 13 43 
1000 
0010 
H=U,P;'=[1 0 0 0 =[1 000 
PS =[ Vo io oll ] 
0001 
0001 
FACTOR , 2, 4)i 
由 此 ， (o o 2 o 2: 4) 返回 
0001 
1 0 1000 0010 
Lz U= P=P,P, = 
[o i] [o 2 o ol” *'7l010 0 
1000 


现在 回 到 算法 第 6 1789 FACTOR(M, 4, 4), ERKL, UMP 相应 地 变 成 LZ，U, 和 P,。 则 
在 第 7 行 计 算 下 式 


000 1 
- 03 00400 10 0030 
E 
4 0 0 0410 100 0004 
1000 
在 算法 第 8 行 可 得 


el ee 


日” 在 这 个 例子 中 ， 所 有 置换 阵 的 逆 恰 好 是 自身 。 
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因此 在 算法 第 9 行 可 得 

0030 

c=D=| 

0004 

在 算法 第 10 行 可 得 
ce 3 0 

-[o 4 

读者 可 自行 验证 对 FACTOR(C'，2，2) 的 调用 结果 为 : 
1 0 3 0 1 0 


L, = [o | U, = [o Aube - P | 
由 此 P, 等 于 1, ， 即 算法 第 12 行 得 到 的 单位 矩阵 ， 同 时 在 第 13 行 可 得 
1000 
| 


H= UP =U = | 200 


最 后 在 第 14 ~ 16 行 可 得 
1000 1000 0001 
L-|0 10 0|y |0 2 0 01, _/0 0 1 0 n 
0010 0030 0100 
0001 0004 1000 


接 下 来 将 对 算法 6. 1 的 正确 性 进行 分 析 与 证 明 。 

定理 6.3 对 于 任意 的 非 奇 异 矩 阵 4， 算 法 6. 1 能 计算 出 L，U 和 P, 使 4=LUP。 

证 明 : 对 于 图 6-2 和 6-3 所 示 的 不 同情 况 的 分 解 细节 的 正确 性 将 留 作 练习 ， 只 要 证 明 以 下 
两 点 : 

1. 在 算法 FACTOR 的 第 2 行 总 能 找到 非 零 列 ， 

2. 在 算法 第 9 TE 总 是 存在 。 

& AA m xn FRE. X m 进行 归纳 ，m 是 2 OME, 证明 如 果 4 RA m, FACTOR 将 计算 出 
L, UMP, 使 4=LUP,L、U 和 和 P 分 别 为 下 三 角 和 矩阵 、 上 三 角 和 矩阵 和 置换 矩阵 ， 其 秩 分 别 为 m, 
m 和 n。 进 一 步 可 得 , U 和 矩阵 的 前 m 列 构成 矩阵 的 秩 为 m。 如 果 m =1， 则 4 一 定 具 有 非 0 TK, 
因此 归纳 假设 条 件 成 立 。 当 m=2", kel 时 ， 因 为 4 存在 m 列 ， 秩 为 m， 在 算法 第 5 行 的 B 和 C 
都 有 m/2 列 ， 且 各 自 的 秩 为 m/2。 由 归纳 假设 ， 在 算法 第 6 行 调用 FACTOR SAMAH L, U, 
ALP,, E U, 的 前 m/2 列 秩 为 m/2。 因 此 第 9 行 可 得 EEE. 

从 图 6-2d 可 以 看 到 A 是 三 个 矩阵 的 乘积 ， 其 中 之 一 为 上 面 U, 下 面 6 构成 。 由 于 4 的 秩 为 
站 ， 所 以 该 矩阵 的 秩 必 须 是 严 。 因 此 ，C 的 秩 为 m/2。 由 于 6 的 前 m/2 WAF, HCE CRH 
m/2 列 所 得 到 的 和 矩阵， 因此，C ' 的 秩 也 为 m/2。 通 过 归纳 假设 ， 在 算法 第 11 行 调用 FACTOR， 得 
到 期 望 的 结果 L, U, 和 P,。 通 过 归纳 假设 能 直接 得 到 结果 。 口 

在 进行 时 间 分 析 之 前 ， 观 察 发 现 置 换 矩 阵 可 以 采用 数组 已 表示 ， 使 得 P[i] =j 当 且 仅 当 在 第 
i 列 的 第 7 行 具有 元 素 1。 通 过 设 定 PP:[i] = P[ 忆 [ 订 ]， 两 个 "xzn 置 换 和 矩阵 的 乘积 可 以 在 
0O(n) 时 间 内 计算 得 到 。 在 这 种 表示 方式 中 ， 置 换 矩阵 的 逆 同 样 可 以 在 O(n”) 时 间 内 计算 得 到 。 

定理 6.4 假定 对 于 每 个 mn， 可 以 在 Mn) BILE nx n 矩阵 的 乘积 ， 且 对 于 所 有 的 
m， 存 在 e>0， 使 得 Mm) 2 1M(mm)。2 则 存在 常数 上 ， 使 算法 6. 1 对 任意 的 非 癌 异 矩阵 至 多 
TE kM(n) 时间。 


O ”直观 上 看 ， 这 个 条 件 要 求 M(n)dk n^** n) 之 间 。 因 此 ， 可 以 说 存在 某 个 常数 上， 使 W(n) = kn?logn， 在 这 种 
情况 下 ， 定 理 的 假设 不 满足 。 
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ER: 令 算 法 6.1i5]H T nxn eM, H. T( m) Wifi FACTOR(A, m, p) FREON, XE 
HAX mxp, mapan, iE FACTOR 的 1 ~4 行 ， 知 存在 常数 上， 使 7T(1) = 如 。 由 于 递 
妇 的 原因 ， 在 算法 第 6 行 和 第 11 行 分 别 需要 7( mv/2) 时 间 ， 在 算法 第 7 行 及 第 13 行 需要 做 置换 
HERRER, OIME On) 时 间 和 任意 矩阵 乘 以 置换 阵 的 情况 。 仅 交换 第 一 个 矩阵 的 相应 
列 。 用 数组 P 表示 置换 阵 ， 很 容易 发 现 第 1 个 和 矩 阵 的 第 P[ 引 列 将 会 变 成 最 终 矩 阵 的 第 i 列 。 该 矩 
阵 的 乘法 结果 可 以 在 0(mn) 时 间 内 得 到 。 因 此 在 算法 第 7 行 和 第 13 行 分 别 需 要 时 间 0( mn) 。 

在 算法 第 9 行 采用 定理 6.2 计算 EE "需要 0(M(m/2)) 时 间 ， 同 样 的 时 间 用 于 计算 积 FE, 
由 于 U, 最 大 为 (m/2) xn， 因 此 , 积 (FE )U, 可 在 以 下 时 间 内 计算 得 到 


n 
o(a) 
注意 ，m 能 整除 上， 因为 它们 都 是 2 的 等 ， 且 普 和 过 nm。 剩 下 的 步 又 可 以 明显 地 看 出 最 坏 情况 为 
0(mn)。 因 此 ， 可 以 得 到 以 下 的 递归 方程 。 
cn 
ar( >)+ aM ()+ dmn, Em»! 


T(m) « | 
bn, 若 m = 1 


(6-5) 
其 中 b, c 和 4d HER, a 
通过 定理 假设 及 M(1) =1， 可 得 M(m/2) 之 (m/2)*。 因 此 ,可 以 结合 式 (6-5) 中 的 第 二 项 和 
第 三 项 。 存 在 某 个 常数 e。， 使 得 
en 
m(z)m(n) en 
bn, 若 m =1 


T(m) < | (6-6) 


从 式 (66) 可 以 得 到 
m 


T(m) « mjg) *M(7)* ee Za (IE bnm < e y en). bnm 
HERBEM m/2') « (172*)'M(m), ， 可 得 
e 


T(m) < iMm) Y (4) + bnm 


m 


FAVS M(m) m^, FER K, T(m) < (hn/m)M(m)。 在 算法 6.1 B, n=m, Bt, 


T(n) <kM(n) 口 
推论 ”给 定 任意 的 非 奇 异 矩 阵 4， 可 以 在 0(n”) 步 内 找到 它 的 LUP OR. 
证 明 : 通过 定理 6.1, 6.3 及 6.4 可 以 得 证 。 口 


6.5 LUP 分 解 的 应 用 


本 节 将 讲述 如 何 把 LUP 分 解 运用 到 矩阵 求 逆 、 行 列 式 计 算 以 及 联 立 线性 方程 组 求解 等 应 用 
中 。 可 以 看 出 ， 上 述 问题 都 可 规约 为 两 个 矩阵 的 乘法 ， 因 此 ， 对 和 矩阵 乘法 渐 近 时 间 复 杂 度 的 改进 
都 会 对 这 些 问 题 求解 的 渐 近 时 间 复 杂 度 有 相应 的 影响 。 反 之 ， 抢 阵 乘法 也 可 以 规约 于 矩阵 的 求 
逆 ， 因 此 抢 阵 乘法 与 矩阵 求 逆 运 算 在 计算 复杂 度 上 是 等 价 的 。 

定理 6.5 令 e>0 且 a>1, 令 M(n) 为 某 个 环 上 的 两 个 矩阵 做 乘法 运算 所 项 的 时 
间 ， 对 于 某 个 a>0，M(2m) 227'M(m), ERE dr de iate ACTA O(M(n)) 时 
间 内 完成 。 

证 明 : 令 4 是 任意 ”xn 的 非 奇 异 和 矩阵 ， 通 过 定理 6.3、6.4 可 以 在 0(M(n)) 时 间 内 
找到 4 =LUP。 因 此 ,4 ”=P UL ,PP "很 容易 地 在 O( n) SARK, UL FE, 








146 . go 


且 可 以 运用 定理 6.2 在 0O(MH(n)) 步 内 得 到 。 积 P 7 可 以 类 似 地 在 O(M (n) ) 步 内 
得 到 。 Oo 
推论 : ”nxn 和 矩阵 的 逆 可 以 在 O(n?" ) EHH RBS, 

定理 6.6 假设 及 (nn) 如 定理 6.5 HR, 4 是 nxn 什 隆 ， 则 可 以 在 O(M(n)) 步 内 计算 
出 det(4) 。 

证 明 ; 运用 算法 6. 1 找到 矩阵 4 的 LUP 分 解 。 假 定 在 算法 第 2 行 不 存在 非 零 列 或 者 在 
算法 第 9 行 不 存在 巨 ” 导致 算法 运行 失败 ， 可 得 4 是 奇异 矩阵 且 det(4) -0, BR, 令 4= 
LUP, Wj det(A) = det( L) det(U) det( P), det( L) fl det(7) 可 通过 主 对 角 元 素 乘积 获得 。 由 
于 工 是 单位 下 三 角 阵 ， 可 得 det(L)=1, HFUBL= ABH, TUE 0(n) 步 内 得 到 
det(U), HF PEP BRE, Wdet(P)= +1, 正 负 号 取决 于 P 所 表示 的 是 奇 排列 还 是 偶 
排列 。 确 定 是 奇 排列 还 是 偶 排 列 通过 从 排列 (1，2，…，z) 实际 进行 交换 得 到 ， 当 前 列 位 
置 的 交换 次 数 ,， 且 至 多 交换 mn -1 次。 口 

推论 : nxn 和气 阵 的 行列 式 可 以 在 O(n?" ) 步 内 得 到 。 


例 6.4 计算 例 6.3 中 矩阵 M 的 行列 式 。 先 求 出 该 矩阵 的 LUP 分 解 
000 1] [10 0 OT1 0 0 oro O O 1 
0020| |0 1 0 olo 2 0 of0 01 0 
03 0 0] Joo 1 Ofo 0 3 of0 100 
400 04 Lo o o ılo 0 0 441 0 0 0 


第 一 个 和 第 二 个 矩阵 的 行列 式 结果 通过 主 对 角 元 素 的 乘积 求 得 ， 分 别 为 +1 和 +24。 现 在 仅 需 要 
知道 最 后 一 个 矩阵 p 是 奇 排列 还 是 偶 排 列 。 因 为 P 表示 排列 (4，3，2，1)， 该 排列 建立 两 个 变 
BAA: (1, 2, 3, 4)2(4, 2, 3，1) 二 (4，3，2，1)， 排 列 为 偶 排 列 ， 因 此 det(P) = +1, 
可 得 det( M) = +24。 口 

定理 6.7 4 M(n) NX «4 6.5 所 描述 ， A X dS E nxn EE, PL b de E 
n, XARAJ EL, z, e, x]. BBE O(M(n) ) 步 内 求解 联 立 线性 方程 组 AX 
=b, 

证 明 : 运用 算法 6.1 Gu A - LUP, M LUPx =b 的 求解 分 为 两 步 。 第 一 步 求解 Ly =b， 得 到 
未 知 向 量 y, 第 二 步 采 用 UPx =y 求 解 x。 上 述 每 个 子 过 程 都 可 以 在 0(r) 步 内 使 用 回 代 法 求 出 ， 
即 先 求解 y, ， 再 用 其 值 代 换 未 知 量 y, URE y, EF., LUP 分 解 可 以 运用 定理 6.4 在 0(M(n)) 
步 内 完成 ,求解 LUPX =b 可 以 在 O(n’ ) AEA SER. 口 

推论 : 具有 个 未 知 数 的 = 个 方程 构成 的 联 立方 程 组 可 以 在 O(n?) SADR. 

最 后 ， 将 证 明和 矩阵 乘法 与 矩阵 求 逆 的 计算 复杂 度 是 等 价 的 。 

定理 6.8 4 M(n)fn I(n) 3I W^ nxn EERS nxn E EREE AE, E 
定 存 在 某 个 e>0， 使 8M(m) 2M(2m) 22"*M(m), I(r) BAW. Rl M(n)faI(n) X TE 3 E 
子 是 等 价 的 。 

证 明 ; 定理 6.5 表明 ， 对 某 个 常数 c ，1(n) <c,M(n)。 对 于 某 个 c,， 为 了 建立 关系 M(n) < 
cin), SAMB A nxn, Bj 


I A 077 Fr -A AB 
fo I 1 -| I -al 
001 0 0 I| 
因此 ， 通 过 求 3n x 3n 矩阵 的 逆 来 求 4B 的 积 ， 可 得 M(n) </(3n) <I(4n) <641(n) o 口 


6.6 布尔 矩阵 的 乘法 
在 5.9 节 中 分 析 了 两 个 布尔 矩阵 乘法 的 问题 ， 其 元 素 选 自 闭 半 环 10，11 ， 且 加 法 及 乘法 运 
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算 定义 如 下 


可 以 证 明 两 个 布尔 矩阵 做 乘法 运算 在 时 间 复 杂 度 上 等 价 于 求 图 的 传递 闭 包 ， 但 遗憾 的 是 ， 
闭 半 环 {0，11| 不 是 环 ， 因 此 ，Strassen 矩阵 乘法 算法 及 至 本 章 为 止 所 提 到 的 结果 在 此 不 能 直接 运 
用 于 布尔 矩阵 的 乘法 。 

很 明显 ， 通 常 矩 阵 乘法 需要 0(m ) 步 -但 至 少 还 存在 两 种 时 间 复 杂 度 低 于 O ) 步 的 布尔 
和 矩阵 乘法 。 第 一 种 方法 的 时 间 崭 近 复杂 度 表 现 更 为 优良 ， 但 第 二 种 在 适 中 的 时 候 更 切合 实际 。 
下 面 定理 中 将 展示 第 一 种 方法 。 

定理 6.9 可 以 在 O, (n^  ) FARAH nxn HREM A BHR, 

证 明 : 模 n+1 的 整数 形成 环 Z,,, ， 运 用 Strassen 矩阵 乘法 算法 在 环 Z, PUR AM BHR 
积 。 令 C 为 该 乘积 ，D 为 该 乘积 对 应 的 布尔 矩阵 。 可 以 看 出 : Ww Dli, j]=0, W C[i, j] =0; 
如 果 D[i, j] 1, Wi<Cli, j])<n, Bik, D 可 以 容易 从 C 得 到 。 口 

推论 1 假如 两 个 大 位 整数 乘法 需要 m(k) 次 按 位 操作 ， 则 布尔 矩阵 乘法 可 以 在 O, (n? m 
(log n) ) 步 内 完成 。 

证 明 ; 由 于 所 有 的 运算 都 基于 Z,,,， 因 此 至 多 和 需要 | logn 」+1 位 来 表示 数值 。 因 此 这 样 的 两 
个 整数 相 乘 至 多 需要 O,(m(log n) ) 时 间 ， 且 加 法 或 者 减法 至 多 需要 O, (log n) 时 间 ， 因 此 不 可 能 
再 大 ， 从 而 得 证 。 口 

在 第 7 章 中 ,将 讨论 一 种 m CK) 为 0,(k log k loglog k) 的 乘法 算法 ， 运 用 这 个 值得 到 如 下 
推论 。 

推论 2 布尔 矩阵 乘法 至 多 需要 0,( "log n log logn log log log n) 步 。 

第 二 种 方法 常 称 为 “4 俄罗斯 人 ”( Four Russians) 算 法， 以 发 明 者 人 数 和 国籍 命名 ， 从 某 种 意 
义 上 比 定理 6. 9 中 的 算法 更 为 “实际 ”。 而 且 ， 该 算法 更 容易 进行 位 向 量 运 算 ， 算 法 6.9 没有 这 个 
性 质 。 

假定 计算 4 和 B 的 乘积 ,它们 是 两 个 nxn 布尔 矩阵 。 为 了 方便 ， 假 定 log n 能 够 整除 n， 则 
可 以 把 4 分 成 mx (log n) 个 子 阵 ， 同 时 B 可 以 分 成 (log n) xn 个子 阵 ， 如 图 6-5 所 示 。 计 算 可 
Bm: 


n/log n 
AB - Y AB, 
i=} 


注意 , RAB, AR EA nx n BE, 假设 可 以 在 O( ) 步 内 计算 出 4.8, WH, RA, 可 以 在 
O(n'/log n) 步 内 计算 出 4B， 因 为 具有 nlog n 个 这 样 的 积 。 

现在 重点 讨论 积 4.8; 的 计算 。 可 以 在 O(n'log n) 步 内 计算 出 来 。 为 了 计算 4,B,， 可 以 对 A, 
中 的 每 行 a 计算 aiB,。 为 了 计算 aB,， 可 以 找到 a 对 应 在 k 列 有 1 的 B, 的 每 个 上行 。 然 后 将 B. 
那些 行 加 起 来 ， 形 成 长 为 n 的 行 的 位 向 量 。 

例如 ， 假 定 


O ”如 果 积 的 所 有 元 素 几 乎 都 是 1 的 话 ， 则 可 以 在 0(m ) 期 望 时 间 内 计算 两 个 布尔 矩阵 的 切 法 ， 计 算 Tien, 
直到 有 一 项 为 1 为 止 。 由 此 可 知 和 为 1。 举 例 来 说 ， 如 果 每 个 元 素 cx 或 5,79 1 的 概率 分 别 为 p， 则 可 以 找到 此 
类 项 的 期 望 值 至 多 为 1/P" ， 与 无关 。 
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00 1 
1 0 1 
100 01.01 100 1 
A=] o o gff&s|00010100 
110 11010000 
000 
0 1 1 
可 得 
11010000 
1101 100 1 
1101 1101 
0101 100 1 
C, 2 AB, = 
00000000 
0101 1 10 1 
00000000 
11010100 


C, 的 第 一 行 仅 为 B, 的 第 三 行 ， 因 为 4, 8958 — T1 DUCES AUGE —- 1. C, 的 第 二 行为 B, 的 第 一 行 
和 第 三 行 的 和 ， 因 为 A, 的 第 二 行 在 第 1 列 和 第 3 列 是 1， 等 等 。 

为 了 计算 aB., SET A, 的 每 行 a, 需要 O(n log n) 时间， 由 于 4 有 nr 行 ， 因此 计算 4.8, 所 需 
的 总 时 间 为 Ormlog n), 

为 了 更 快 地 计算 积 4,8;,， 可 以 观察 4; 的 各 行 具有 log n TOUR, HA, 中 各 元 素 要 人 么 为 0 要么 
为 1。 因 此 ， 至 多 只 有 2“" =n 个 不 同 的 行 。 





6-5 布尔 矩阵 4 B 的 划分 


因此 ，B, 各 行 的 可 能 和 仅 有 = 个 不 同 的 值 。 可 以 预先 把 B, 各 行 的 可 能 和 求 出 来 ， 不 计算 
aB, WRA a, 的 表 简 单 索引 查询 相应 的 结果 。 

这 种 方法 仅 需要 O(n’ ) 时 间 计 算 4,B,。 原 因 如 下 。B， 行 的 子 集 有 空 集 ， 单元 素 的 集合 ， 或 
者 是 单元 素 集合 与 一 个 小 集合 的 并 集 。 可 以 通过 选择 恰当 的 计算 顺序 ， 把 一 行 加 到 前 面 已 经 得 
到 结果 的 基础 上 。 因 此 ， 可 以 在 O(” ) 步 内 计算 B, 中 行 的 所 有 n 个 和 。 在 此 和 的 基础 上 ， 把 它 
们 放 在 数组 中 ， 针 对 4,m 行 的 每 个 不 同行 选择 相应 的 和 。 

算法 6.2 4 俄罗斯 人 布尔 矩阵 乘法 算法 。 
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输入 : 两 个 nxn 的 布尔 矩阵 4 和 B, 

输出 : FAC=AB 

方法 : 4 mW logn ], HA 划分 成 4 ，4:，…，4rfwl， 其 中 4;(1<i<fnm1) 表 示 和 矩阵 4 
由 第 m(i -1) +1 列 到 第 mi 列 构成 的 矩阵 ， 且 4jv 由 剩 下 的 列 构成 ， 通 过 补充 0 列 达到 必需 的 
mJ, RAER B X B,, B,, ^c, Bruny, RP BO <i <[n/m)) RARE BASS m(i-1) +1 
行 到 第 mi 行 构成 的 矩阵 ，Bi 由 剩 下 的 行 所 组 成 。 如 果 不 够 严 行 ， 通 过 补 0 行 实 现 。 所 述 情况 
如 图 6-5 所 示 。 计 算 过 程 如 图 66 所 示 。 采 用 NUM(v) 表 示 0 和 1 的 向 量 v Bt. 例如，NUM 
([0, 1, 1]) =6。 口 









for i — 1 until [n/m] do 


comment 计算 B 中 各 行 的 和 , PATA, ..., bo. 


2. ROWSUM[O] + [0,0,..., 0]; 0 的 个 数 为 n 
3. for j — 1 until 2" — 1 do 
begin 
4. AS NE BRIE AO <2 A: 
5. ROWSUM[/] + ROWSUM[j— 2*] + 99° 
` end; 
6. 4 C/ABEFEDJUR/S (1<j<n) HROWSUM[NUM(a)), 
end 其 中 a 为 4 的 第 / 行 


let C be Xi?! C, 





(D HR, 这 里 的 求 和 是 按 位 布尔 操作 。 


6-6 4 俄罗斯 人 算法 


定理 6. 10 计算 C=4B 的 算法 6.2 可 在 0O(mvlogn) 步 内 完成 。 

证 明 : 对 j 进行 归纳 可 得 算法 第 2 ~5 行 的 ROWSUM[ 有 站 是 7 的 二 进 制 表示 方法 中 具有 1 的 位 
置 上 对 应 B, 中 b, 行 按 位 布尔 求 和 的 值 ， 该 位 置 是 从 右 往 左 进行 计算 的 第 个 位 置 。 在 算法 第 6 行 
得 到 C, =4.B8,， 然 后 在 第 7 行 得 到 C=4B。 | 

在 算法 时 间 复 杂 度 方面 ， 首 先 考虑 3 ~ 5 行 的 循环 。 第 5 行 的 赋值 语句 明显 需要 0(n) - 
步 。 在 第 4 行 计算 需要 0(m) ， 比 0(n) 小 ， 所 以 第 4 ~5 行 整体 循环 复杂 度 为 0(n)。 这 
个 循环 要 重复 2" -1 次 ， 所 以 循环 复杂 度 是 0(n2")。 由 于 mlogn， 则 第 3 ~5 行 的 循环 复 
REH Oln )。 口 

在 第 6 行 ,计算 NUM(a) 的 时 间 复 杂 度 是 O( m) ， 复 制 向 量 ROWSUM[ NUM(a) ] fj 
复杂 度 为 0(n) ， 因 此 ， 第 6 行 的 复杂 度 是 0(m)。 由 于 [n/m1<<2n/logn， 且 第 1~6 行 
的 循环 执行 [n/m 1 次 ， 则 时 间 复 杂 度 是 O(n'/log n)。 同 样 ,第 7 步 至 多 需要 2n/log n 来 
TRAA nxn BERRA, BIBS 0(n /iog n) 步 。 因 此 ， 整 个 算法 的 时 间 复 杂 度 为 
O(n’ /log n) BP, m 

更 为 有 趣 的 事情 是 若 具 有 针对 位 串 进行 操作 的 逻辑 和 算术 指令 ， 则 算法 6. 2 只 需要 O,, (n’/log n) 
的 位 向 量 步 运算 。 

定理 6. 11 算法 6.2 可 以 在 Ob,(n /log n) 的 位 向 量 步 内 完成 运算 。 

证 明 : 设置 累加 器 用 来 确定 何 时 增加 k。 初 始 累 加 器 的 值 为 1，& 的 值 为 0。 在 j 每 次 增加 时 ， 
累加 器 的 值 减 1， 除 非 值 为 1， 此 时 累加 器 的 值 设置 为 j 的 新 值 ， 且 的 值 增加 1。 

在 图 6-6 中 算法 第 2 行 和 第 5 行 需要 常数 步 。 因 此 ,第 3 ~5 行 的 循环 是 0w (n) 。 在 算法 第 
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6 行 建 立 C;,， 注 意 ， 由 于 在 RAM 中 可 用 整数 表示 位 向 量 ， 因 此 计算 NUM Ca) 不 需要 时 间 。9 因 

此 ，(C; 的 每 行 可 以 在 常数 位 向 量 步 内 找到 ， 第 6 行 需要 Onn) 。 因 此 第 1 ~6 行 的 循环 复杂 度 是 

O,, (n’/logn), BE 7 行 的 复杂 度 一 样 。 Oo 

习题 

6.1 证 明 整 数 模 WERA. BZ, 是 环 (10, 1, =, n-1}, +, *,0, D, 其 中 a+5 和 
a * b JR n 的 普通 加 法 和 乘法 运算 。 

6.2 证明 元 素 选 自 某 个 环 尺 的 nxn 和 矩阵 的 集合 M, 形成 环 。 

6.3 给 出 例子 证 明和 矩阵 的 乘法 不 符合 交换 律 ， 即 使 其 元 素 选 自 某 个 环 ， 且 其 中 乘法 运算 符合 交 
换 律 。 

6.4 用 Strassen 算法 计算 乘法 : 

b all> sl 

3 43717 8 


Strassen 算法 的 另 一 个 版 本 采用 以 下 恒等式 帮助 计算 两 个 2 x 2 矩阵 的 积 。 


$, = Q4 td, m, = s,s t =m, +m, 
$475,740, m = 4,5, t,-t, +m, 
5 = da -a m, = ayb, 


$4 2705,-5 M, = $5 
ss = ba -ba ms = 5,5, 
se = by ~ 5, m, = sby 
s, = ba -bs mM, = ays, 
Sg = 56 — by 
结果 的 矩阵 元 素 为 : 
cl =m, +m, 
Cy =f, +m, +m, 
Cy 75 -m, 
Cy = t, +m, 
证 明 这 些 元 素 计 算 了 等 公式 (6-1) ， 且 仅 需 要 7 次 乘法 和 15 次 加 法 运算 。 
证 明 对 于 mxzn 扼 阵 4，B8 和 C， 以 下 公式 成 立 。 
a)JAB =I, AC = 了 可 得 有 =C 


b)A'lAzI 
c)(AB) ' ZB^ 4"! 
d)(A7') =A 


e)det( AB) = det( A) det( B) 

定理 6. 2 表明 非 奇 异 上 三 角 和 矩阵 的 逆 对 于 某 个 C， 可 以 在 cn**" 内 完成 算术 运算 。 假 定 为 2 

AYE ELK AW Strassen 算法 进行 矩阵 乘法 ， 找 出 常数 c- 

用 数组 忆 表 示 置 换 矩 阵 ， 当 且 仅 当 第 ; 列 的 第 7 行为 1，P[i] =j。 > P MP, 为 两 个 nxn 
置换 矩阵 的 表示 数组 。 


但 ”表示 方法 的 详细 说 明 : NUM( ai ) 是 表示 a; 的 反 序 的 整数 ， 取 自 B, 的 “第 j 行 "是 从 底部 开始 的 第 j 行 ， 而 不 是 前 
面 所 提 及 的 从 顶部 开始 的 。 
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a) WEAR P,P [i] =P,[P,[i]]. 
b) 给 出 一 个 0(n) 算 法 计算 PL 
c) 改 变 表 示 方 式 ， 当 且 仅 当 第 i 行 的 第 j 列 为 1 时, PLI] 2j, 给 出 正确 的 PP, 公式 ， 同 时 
给 出 计算 PL 的 算法 。 
6.9 用 算法 6. 1 计算 以 下 矩阵 的 LUP 分 解 。 


0 0 1 2 
M =|? 0 3 0 
1 -1 0 1 


2 0 -1 3 
6.10 已 经 证 明 LUP 分 解 、 和 矩阵 求 逆 、 行 列 式 的 计算 以 及 线性 方程 组 的 求解 都 是 0, (7) , B 
定 采用 Strassen 算法 做 矩阵 乘法 , ”是 2 IURE, 采用 算法 6. 1 及 定理 6.4 -6.7, 分别 找到 
最 合适 的 常数 因子 。 
6.11 用 本 章 讲述 的 方法 求 习 题 6.9 中 和 矩阵 M 的 道 及 行列 式 。 
6.12 用 LUP 分 解 求解 下 述 联 立 线 性 方程 组 : 
X, 42x, = 了 
3x, 29 
X —-%, +X =3 
2x, — x, +3x, = 10 
6. 13 证 明 任意 的 排列 不 是 奇 排列 就 是 侦 排 列 ， 但 不 可 能 同时 是 两 种 排列 。 
6.14 ”分 别 采用 定理 6.9 中 的 算法 及 4 RENARE T KERRE. 
1 0 0 0770 10 0 
00 1 1[|1 10 0 
100 1/|10 1 0 
0.01 010 00 1 
6.15 通过 证 明 图 6-2 及 图 6-3 间 的 有 效 关系 来 完成 定理 6. 3 的 证 明 。 

"6.16 考虑 模 2 运算 的 整数 域 >F,， 寻 找 一 种 基于 F, 的 n xn 和 矩阵 乘法 算法 ， 渐 近 复杂 度 为 到 "/ 

(log n)"“[ 提 示 : 把 矩阵 划分 成 大 小 为 Viog n x Slog n 的 矩阵 块 ] 。 
6.17 估算 n 的 值 ， 使 之 当 超过 该 数值 时 ，n*™ <n’/logn。 

*6.18 令 L(n) 为 两 个 nxn 下 三 角 和 矩阵 相 乘 所 需 的 时 间 ，T(n) 为 任意 两 个 矩阵 相 乘 所 需 的 时 间 。 
证 明 存 在 常数 c, 使 T(n) <cL(n)。 

6.19 证 明 上 (下 ) 三 角 和 矩阵 的 逆 还 是 上 (下 ) 三 角 和 矩阵 。 

*6.20 令 I(n) 和 U(n) 分 别 为 求 任意 nxn 和 矩阵 及 nxn 上 三 角 和 矩 阵 的 逆 所 需 的 时 间 步 数 。 证 明 存 
在 常数 <， 对 于 所 有 n, 使 1(n) <cU(n)。 

6.21 为 了 计算 矩阵 积 C=A4B， 可 以 先 计 算 积 D = (PAQ (CQ BR) ， 然 后 计算 C= P- DR, w 
果 P，Q 和 为 某 些 矩 阵 ， 比 如 置换 矩阵 ， 乘 法 PAQ, QBR 及 P^ DR 不 需要 环 元 素 的 
乘法 运算 。 采 用 这 种 思想 寻找 另外 一 种 2 x2 矩阵 的 乘法 算法 ， 只 需要 7 次 乘法 操作 。 

6.22 证 明 当 LU 存在 时 ， 非 奇异 矩阵 4 的 LU 分 解 是 唯一 的 [提示 : 假定 4 HL,U, 2 L,U,, 证 明 
Ly'L, = U,U;! =. 

6.23 证 明 : 如 果 4 是 非 奇异 矩阵 ， 且 4 的 任意 主子 阵 是 非 奇 异 的 ， 则 4 存在 LUP 分 解 。 

6.24 奇异 矩阵 具有 LUP 分 解码 ? 





O “ 域 "的 定义 见 12.1 节 。 
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**6.25 ”假定 4 是 实数 的 nxn RE, MRE EASES x, 0848 x Ax 20, WA 为 正定 
EE, 

a) uEBI S| 6. 5 可 以 用 于 求 取 任意 非 奇异 的 对 称 正 定 和 矩阵 的 道 。 

b) 证 明 AA" 总 是 正定 和 对 称 的 。 

c) 采 用 a) 和 b) 中 的 结论 ， 给 出 一 个 0(M(n) ) 算 法 用 于 求 任意 实数 的 非 奇 异 矩阵 的 逆 。 
d)(c) 中 的 算法 对 模 2 的 整数 域 有 效 吗 ? 

* 6. 26 nxn REE AIK (Toeplitz) ERE A 具有 如 下 性 质 


Ali, j] :A[i - 1, j-1], 2<i, j<n 
a) 寻 找 特 普 利 茨 矩阵 的 表示 方式 ， 使 两 个 mn x n BEAK IE O(n) 次 操作 内 
完成 。 


b) SH n x n 的 特 普 利 茨 矩 阵 和 列 向 量 相 乘 的 分 治 算法 。 需 要 多 少 次 算术 操作 ? [提示 : 
采用 分 治 算法 可 以 获得 O(n?) 的 结果 。 第 7 章 将 采用 一 种 新 技术 来 优化 这 个 结果 。] 
c) 寻 找 有 效 的 渐 近 算法 用 于 两 个 ”xn 特 普 利 茨 矩 阵 相 乘 。 该 算法 需要 多 少 次 算术 操作 ? 

注意 特 普 利 芯 矩阵 相 乘 的 结果 不 一 定 是 特 普 利 芯 和 矩阵 。 


研究 性 问题 


6.27 一 个 固有 的 问题 是 直接 提高 Strassen 算法 的 效率 。Hoperoft 和 Kerr[ 1971] 已 经 证 明基 于 任 
意 环 的 2 x2 FORMER 7 次 乘法 操作 。 但 递归 算法 可 能 基于 另外 更 小 规模 的 矩阵 。 例 
如 ， 如 果 3 x3 REAR BERE dE 21 次 乘法 操作 内 完成 ， 或 者 4 x 4 矩阵 在 48 次 操作 内 完 
成 ，Strassen 算法 的 效率 就 可 以 渐 近 提高 。 

6.28 ”最 短路 径 问 题 能 够 在 低 于 0(n ) 步 内 完成 吗 ? Strassen 算法 并 不 适合 由 包括 + oo 的 非 负 实 
数 构成 的 财 半 环 ， 但 在 做 布尔 矩阵 运算 时 可 以 把 闭 半 环 嵌入 到 一 个 环 中 。 


文献 和 注释 


Strassen 算法 取 自 Strassen[ 1969 ] 。Winograd[ 1973] 把 加 法 次 数 降 为 15 次 ， 该 方法 优化 了 党 
数 因 子 ， 但 在 复杂 度 的 阶 上 没有 变化 ( 见习 题 6.5) 。 

Strassen[ 1969 ] 同样 给 出 了 时 间 复 杂 度 为 0(n*”) 的 和 矩阵 求 逆 、 行 列 式 计算 和 联 立 线性 方程 
组 求解 的 算法 ， 在 此 假定 所 有 和 抢 阵 均 为 非 奇异 矩阵 。Bunch 和 Hoperoft[ 1974] 给 出 在 O ( à?" ) 3b 
内 进行 LUP 分 解 的 算法 ， 前 提 是 初始 矩阵 为 非 奇异 矩阵 。A.，Schinhage 独自 证 明了 基于 有 序 域 非 
奇异 矩阵 的 求 道 运算 可 以 在 0(n*”) 步 内 完成 (习题 6. 25), 

和 矩阵 乘法 不 难于 和 矩阵 求 逆 的 结论 由 Winograd[ 1970c] 得 到 。Fischer 和 Meyer[ 1971 ] 给 出 布尔 
矩阵 乘法 的 O, (n^ ) WIE, “4 俄罗斯 人 ”算法 由 Arlazarov, Dinie, Kronrod 和 Faradzev [ 1970 ] 
给 出 。 

更 多 关于 矩阵 的 数学 方法 ， 可 以 查阅 Hohn[ 1958 ] 。 一 些 代数 概念 ， 如 环 理论 可 以 在 Ma- 
cLane 和 Birkhoff[ 1967] 中 找到 。 习 题 6. 13 的 解决 方案 可 以 在 Birkhoff 和 Barteef 1970] 中 找到 。 习 
题 6. 16 H J. Hopcroft 提出 。 





^ — m a à AA Y. 


2 ^ L 1L A1A. A — a. 


第 7 章 快速 传 里 叶 变换 及 其 应 用 


传 里 叶 变 换 已 广泛 应 用 于 科学 和 工程 领域 ， 所 以 ， 计 算 传 里 叶 变换 的 有 效 算法 很 重要 。 另 
外 ， 傅 里 叶 变换 很 普遍 ， 很 有 必要 设计 一 个 高 效 的 传 里 叶 变换 算法 。 在 许多 应 用 中 ， 习 惯 于 把 一 
个 问题 转化 为 另外 一 个 比较 简单 的 问题 ， 如 两 个 多 项 式 乘积 的 计算 。 首 先 对 多 项 式 系数 向 量 进 
行 一 次 线性 变换 ， 再 对 系数 向 量 进行 一 次 简单 的 卷 积 操作 ， 最 后 再 进行 一 次 逆 变 换 便 可 得 到 多 
项 式 的 期 望 乘积 。 这 种 线性 变换 就 是 离散 傅 里 时 变换 。 

本 章 主要 研究 传 里 叶 变换 、 傅 里 叶 的 逆 变 换 以 及 它们 在 计算 卷 积 和 各 种 类 型 乘积 中 的 作用 。 
本 章 将 设计 一 个 高 效 的 算法 ， 即 快速 传 里 叶 变换 (FFT) ， 通 过 除法 计算 多 项 式 的 值 ， 同 时 利用 多 
项 式 在 单位 根 上 计 值 的 特点 。 

还 将 证 明 卷 积 理论 。 把 卷 积 解释 为 单位 根 的 多 项 式 计算 、 样 本 值 的 乘法 和 多 项 式 插 值 。 我 
们 将 利用 快速 傅 里 叶 变换 设计 一 个 高 效 的 卷 积 算法 ， 然 后 把 高 效 的 卷 积 算法 用 到 多 项 式 的 符号 
乘法 和 整数 的 乘法 运算 中 。 所 产生 的 整数 乘法 算法 ， 所 谓 Schönhage - Strassen 算法 是 已 知 的 渐 近 
最 快 的 两 个 整数 相 乘 的 方法 。 


7.1 离散 备 里 叶 变换 及 其 逆 变 换 


傅 里 叶 变 换 常 定义 在 复数 域 上 。 把 传 里 叶 变换 定义 在 任意 交换 环 ( commutative ring)(R, + 
,0, 1) ,其 原因 在 后 面 将 会 明了 。R 中 的 元 素 o 定义 如 下 ， 
1. oe 
.9'-1, 并 且 


3. Y = 0(1 <p <n) 
j*9 


> 


TERK o HH È n 次 单位 根 (principal nth root of unity), WE o, w, =, wo ABs n KH 
43.46 (nth roots of unity) 。 

例如 : e™"( 其 中 i= VY 一 站 是 复数 环 中 的 主 n 次 单位 复 根 。 

假设 a = 【a。，a, ，…，a,_1]” 是 一 个 长 度 为 n 的 ( 列 ) 向 量 , 各 个 分 量 均 是 集合 RR 中 的 元 素 。 
假设 整数 n 在 R 上 存在 乘法 的 逆 Y?， 并 且 RR 存在 主 4 次 单位 复 根 w。 假 设 4 是 一 个 nxn 和 矩阵 ， 其 
ALi, j] =@'(O<i, j<n). MB F(a) =4a = Xiao 称 为 a 的 离散 傅 里 叶 变 的 ， 其 第 ;个 分 
BE 5,(0<i<n)。 若 矩阵 4 是 非 奇异 的 ， 则 4 存在 ， 且 4 有 着 引 理 7. 1 定义 的 简单 形式 。 

引 理 7.1 假设 尺 是 一 个 交换 环 ， 且 存在 主 次 单位 根 w， 其 中 在 RR 中 存在 乘法 的 逆 。 假 
WAdÉ— A nxn E, RA j FIRB o (0xi, j«n), BA A" TEXE, ER j t oU 
(1/n)o *, 

证 明 ; 假设 当 i=j 时 5, =1， 其 他 情况 下 为 0。 很 显然 ，4 - 的 定义 如 上 面 所 述 ， A* A7 =I, 
也 就 是 4. 4- 的 第 六 个 元 素 是 





日 ”交换 环 是 一 个 乘法 (和 加 法 ) 符 合 交换 律 的 环 。 
日 ”整数 出 现在 任何 环 中 ， 即 使 是 有 限 环 。 把 nn 写成 1+1+… +1(n 次 )， 其 中 1 是 乘法 单位 元 。 也 就 是 ww -1 =1， 
说 明 w 存在 逆 元 ， 这 样 就 可 以 讨论 o TE. 
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n-i 
“FS oto =5,  #FO<ij<n (7-1) 


n iz 3 


WR ij, 公式 (7-1) 左 边 化 简 为 


res! 
WR ij, 假设 g=i- j, 公式 (7-1) 左 边 可 以 化 简 为 
Lys (-n<q<n,q#0) 
如 果 g>0， 则 
L5 » z0 


因为 w 是 主 n 次 单位 根 。 如 果 g <0， 那 么 乘 以 ww ， 重 新 调整 和 式 中 各 项 的 顺序 ， 用 
-4 替换 q 可 以 得 到 


R-i 
Ly. (0«q2«n) 
n £26 


HF o EE n 次 单位 根 ， 所 以 它 的 值 为 0。 方 程 (7-1) 马 上 可 以 得 证 。 口 
向 量 F'(a)-A'a, FR (0i <n) NARA 
LS awt 


是 a 的 离散 传 里 叶 变 接 的 北 。 很 显然 ，a 变换 的 逆 变 换 就 是 aks, the F Fa) =a, 
在 传 里 叶 变 换 和 多 项 式 计 值 /插值 之 间 存 在 紧密 的 关系 ， 假设 


p(x) = Far 
E 1) 次 多 项 式 。 这 个 多 项 式 可 以 用 两 种 方式 唯一 一 地 表示 ， 一 种 表示 为 系数 列表 ae a, ，…， 

， 或 者 在 n 个 确定 点 x。，x,，…，%,-! 列 出 它 的 值 。 找 到 表示 多 项 式 系 数值 r, x, e, ai 
BARI ab I 

计算 向 量 [a。，a, ，…，a,_1] HORN ERS AFELA Dias’ 的 系数 表示 转换 到 在 
Rio, w, o, o7 上 的 值 表示 。 类 似 地 ， 传 里 叶 变换 的 道 等 同 于 在 多 项 式 的 第 = 次 单位 根 上 进 
行 插值 操作 。 

可 以 定义 在 点 集合 ， 而 不 是 在 第 n 次 单位 根 上 的 变换 。 例 如 ， 可 以 使 用 整数 1，2，.…，n。 
然而 ， 通 过 对 o 的 筹 选 择 ， 计 值 和 插值 操作 会 变 得 非常 直接 。 在 第 8 章 中 ， 健 里 叶 变 换 用 到 任意 
点 上 对 多 项 式 进行 计 值 和 插值 。 

傅 里 叶 变 换 的 一 个 主要 应 用 是 计算 两 个 向 量 的 卷 积 操作 。 假 设 

a= (a,,a,,+,0,,]" Mb = [borbi 5, .]7 
是 两 个 列 问 量 。 a 和 b 向 量 的 卷 积 操作 表示 为 a@@b， 结 果 是 向 量 c = [co 6, s 6, u]", HH 
c= Eoad (WMF k «0 MH kn, Bika, = 六 =0)。 则 
Co = Gb, c, = a,b, + aibo ,cs = a,b, + a,b, + a,b, 
FF. È, cn =0， 在 这 里 保留 它 的 目的 是 为 了 对 称 。 
为 了 说 明 卷 积 操作 ， 再 回顾 一 下 多 项 式 的 系数 表示 法 。 两 个 (n -1) 次 多 项 式 的 乘积 


p(x) = Yos Ra) = bx 
是 (2n -2) 次 多 项 式 


p(x)q(x) = by [ Dob, x 
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从 上 面 可 以 看 出 ， 如 果 忽 略 cv (6, =0) ， 那 么 多 项 式 乘 积 的 系数 正好 是 两 个 原始 多 项 式 
的 系数 向 量 [ao a,, +, al PIS, 5, oe, 5,]" 卷 积 的 分 量 ， 
如 果 用 系数 来 表示 两 个 (n -1) 次 多 项 式 ， 那 么 可 以 通过 计算 两 个 系数 向 量 卷 积 的 方式 来 计 
算 其 乘积 的 系数 。 另 一 方面 ， 如 果 用 第 = 次 单位 根 上 的 值 来 表示 p(x) 和 g(x)， 那么 ,可 以 简单 
地 把 对 应 根 上 的 对 值 相 乘 来 计算 它们 乘积 的 表示 值 。 这 说 明 两 个 向 量 a 和 b 的 卷 积 是 两 个 向 量变 
换 的 分 量 乘 积 的 道 变换 。 形 式 化 表示 为 : a@b = F"'(F(a) .Pb))。 也 就 是 说 ， 卷 积 运算 可 以 
先 使 用 传 里 叶 变 换 ， 然 后 计算 它们 对 应 的 乘积 ， 最 后 再 进行 一 次 逆 变 换 得 到 。 唯 一 存在 的 问题 在 
于 ， 两 个 (n -1) 次 多 项 式 的 乘积 通常 是 一 个 (2n -2) 次 多 项 式 ， 要 表示 它 需 要 2n -2 个 不 同 点 的 
值 。 这 个 技术 在 下 面 的 定理 中 得 到 了 解决 ， 考 虑 p(x) 和 g(x) 是 (2n -1) 次 多 项 式 的 情形 ， 其 中 > 
的 最 高 次 (n - 1) 的 系数 是 0[ 即 ， 把 (n ~1) 次 多 项 式 当 作 (2n -1) 次 多 项 式 来 处 理 ] 。 
定理 7. 1 SRE (Convolution Theorem) 假设 
a = [2a,,2,,*,0,., ,0,:,0]7 
fu 
b = [b,b sba 0,017 
是 长 度 为 2n 的 列 向 量 。 假 设 
F(a) = [aasma] 
和 
F(b) = [bobb na] 
是 它们 的 传 里 时 变换 ， 那 么 8@b = 下 (F(a).F(b))。 
证 明 ; 因为 a; 2b; =O(nsi<2n), SO sl «2n 


a’, = ¥ aot Alb’, = F bo" 


那么 
= by Y abo” (7-2) 
假设 a@b = [e, e, c. Cn- iJ" Al F(a@b) = [co， 65,75, calc 
因为 o = Xj ab， 所 以 有 
ov = Y F ab,” (7-3) 
交换 式 (7-3 ) 中 加 法 顺序 并 且 用 下 BÉ p - -j 得 到 
c= Y Xs wt) (74) 


HX b, -0(k«0), 可 以 把 内 层 加 法 下 限 增 大 到 上 = 0。 类 似 地 ， 因 为 w =0 (jen), HR 
连 加 的 上 限 缩小 到 n - 1。 无 论 7 的 值 是 多 少 ， 内 部 连 加 的 上 限 至 少 为 n。 由 于 b=0 (ken), 可 
以 把 上 限 替换 为 n - 1。 通过 这 些 修 改 ， 公 式 (74) 就 和 式 (7-2) 相 同 了 ， 所 以 有 c', =a',b,。 我 们 
可 以 得 到 F(a@b) = F(a) - F(b), Bla eb-F'(F(a) - F(b)) RE- 口 

两 个 长 度 为 n 的 向 量 的 卷 积 是 长 度 为 2n 的 向 量 ， 这 需要 卷 积 定理 中 对 向 量 a 和 向 量 DIC 
补 "n 个 0。 为 了 避免 这 项 “填充 ”， 可 使 用 “ 包 ” 卷 积 。 


定义 假设 a= [ao， Gy 7*5, a] fübz[5, b, Ut, b, i] "是 两 个 长 度 为 n 的 向 量 。 a 
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fn b iA iE & 3 f ( positive wrapped convolution) 是 向 量 c = [e,, ¢,, cc, c, 4] , HP 


ci = DES 十 x a,b, ni 
a 和 bb 的 负 包 卷 积 (negative wrapped convolution) 是 向 量 d 2 [d,, di, -«, d, ,]^, AF 


d; = 2,25. 一 Y abri 

稍 后 ，7. 5 节 中 的 Schónhage-Strassen 算法 ， 一 个 快速 整数 乘法 算法 用 到 该 卷 积 。 而 由 目前 观 
察 所 知 ， 可 以 在 第 = 个 单位 根 上 对 两 个 nm -1 次 多 项 式 计 值 ， 并 且 把 对 应 根 上 的 值 相 乘 。 这 给 出 
了 nn 个 值 ， 通 过 这 些 值 可 以 对 唯一 的 n-1 次 多 项 式 进行 插值 。 这 个 唯一 多 项 式 的 系数 向 量 正好 
是 两 个 原始 多 项 式 系 数 向 量 的 正 包 卷 积 。 

定理 7.2 假设 a=[ao, a, c, a] f bob, b, on, bu)" 是 两 个 长 度 为 n 的 向 
量 。w 是 主 n 次 单位 根 ， 并 且 洲 =w。 假 设 n 有 一 个 乘法 的 送 。 

1.8/9 b 的 正 包 卷 积 可 以 由 亚 (F(a) - F(b)) 计 算 。 

2. 假设 d= [do, d, =, d l 是 a 和 b 的 负 包 卷 积 , 令 &, 了 和 6 分别 表 示 
[ao, pa,, 77, Va al, Lb, pbi, cn, y bul 和 [do, pd, ---, y da, mad- 
F'(F(8) - F(b)). 

证 明 : 通过 观察 J^ = -1， 证 明 类 似 于 定理 7.1， 详 细 的 证 明 过 程 留 作 练习 。 口 


7.2 快速 傅 里 叶 变换 算法 


如 果 假 设 环 R 中 任意 元 素 的 算术 操作 只 需要 一 步 便 可 完成 ,那么 RP ye a 的 傅 里 时 变换 
和 传 里 叶 逆 变 换 均 只 需要 O (n^ A, Sn E2 HEN, MEE, HAREM SRA 
叶 逆 变换 的 算法 均 只 需要 0,(nlogn) 时 间 ， 可 推测 这 就 是 最 优 情况 。 这 一 节 给 出 傅 里 叶 变换 的 算 
法 ， 其 逆 变 换算 法 类 似 ， 所 以 留 给 读者 自己 完成 。 快 速 仿 里 叶 变换 ( FFT) 的 基本 思想 本 质 是 代 
数 。 我 们 发 现 Aa PRA n 个 部 分 和 之 间 的 相似 性 。 本 节 假 设 n=2*， 其 中 是 整数 。 

前 面 讲 到 Aa 的 值 等 同 于 多 项 式 p(x) = ?wax ， 其 中 x =w，w ，…，w"。 然 而 ， 多 项 式 
P(x) 在 x =a 点 上 的 值 等 于 p(x) 除 以 x -a HRM. (WTR, 假设 p(x) = (x -a)g(x) +e, 
其 中 c 是 常量 , 那么 p(a) =c。j] 这 样 ， 当 一 个 (n -1) 次 多 项 式 p(x) = Xj ak 除 以 每 个 x - o, 
x-o ,v,x-o' "了 时， 傅 里 叶 变 换 的 计 值 归 约 为 找 余数 的 操作 。 

简单 地 用 pP(x) 除 以 每 一 个 x -需要 0(m) 过 程 。 为 了 获得 快速 算法 ， 把 x -o BAR, 
然后 把 产生 的 n/2 个 多 项 式 再 两 两 相 乘 ， 直 到 最 后 剩 下 两 个 多 项 式 g, 和 gq,， 这 两 个 多 项 式 的 每 一 
个 都 是 半数 的 x - w 乘积 。 接 着 ， 用 p(x) 分 别 除 以 q, 和 9， 得 到 两 个 余数 多 项 式 m (ORI n (x) , 
它们 的 最 大 等 为 w2 - 1。 对 于 每 个 w ，* o ME 9, 的 因子 ， 计 算 p(s) RU x - w' 的 余数 等 同 于 
计算 (xz) 除 以 x -w' 的 余数 。 类 似 地 ， 对 于 每 个 w'，x - 都 是 9 的 因子 。 这 样 ， 计 算 p(x) RL 
BUB x -w 的 余数 等 于 计算 多 项 式 r,(x) 和 7r,(%*) 除 以 所 有 0/2 个 x-w' 的 余数 。 递 归 使 用 这 种 分 
治 法 比 直 接 用 p(x) 逐 个 除 以 x -w' 更 加 高 效 。 

x -w' 相 乘 时 ， 期 望 乘积 包含 交叉 乘 项 ( cross product terms) 。 然 而 ， 通 过 合理 安排 x - wi 的 顺 
E, 可 以 使 所 有 得 到 的 乘积 有 x -o 这 种 形式 ， 进 一 步 减 少 花费 在 多 项 式 乘 和 除 的 时 间 。 下 面 详 
细 地 介绍 这 种 思想 。 

假设 c，c， …，c JE, m, cn, o 的 排列 ,后面 将 说 明 。 定 义 多 项 式 qu, 其 中 0<m 
<k, LÆ RHES, HOSI? - 1, 该 多 项 式 如 下 : 


t+2°-1 


Om = I[6-» 





m 1 aia Bh o A 
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这 样 ， 多 项 式 quAPx-e)(x-e) (x76), qx - ce, 一般 
Qi = dis 101.277, 71 
存在 2“" 个 第 二 个 下 标 为 m 的 多 项 式 ， 每 一 个 x -ci 正好 是 这 些 多 项 式 中 的 一 个 因子 。 多 项 式 qu 
如 图 7-1 中 所 示 ( 参 见 8.4 和 8.5 节 )。 






Q2h5- 5, k- 1 


ix — co) x — eq) ix — c2) ix — c3) Ue — c4 22d x = 64-1) 





7-1 多 项 式 qin 


我 们 是 对 每 个 1 计算 p(x)/gqio(x) 的 余数 。 为 此 ， 首 先 对 每 个 多 项 式 g 计 算 p(x)79,, (x) BS 
余数 ， 从 m=k~1 开始 到 m=0 结束 。 
假设 我 们 已 经 计算 了 (2” -RERA rr。 是 p(x)/qm(%) 的 余数 。[ 假 设 r =p(x) ] 因 为 
Yim =9'9" 5 其 中 9 74, , TH 4-44", m-l, 我 们 断言 p(x)/q'(x) 和 rs/g'(x*) 有 相同 的 余数 ， 
并 且 这 个 断言 对 于 q”(x) 也 是 成 立 的 。 在 证 明 中 假设 
p(x) =h,(x)q'(x) 十 mm-i 
其 中 多 项 式 的 次 数 7, ,最 大 可 达 2"' -1。 因 为 
p(x) Sh (x)qu (x) +7, 
我 们 可 以 得 到 下 式 
h (x)q' (x) tT ad =h,(x)q,,(*) tT. (7-5) 
FEX (7-5) 两 边 同 时 除 以 9 (x) ， 可 以 看 到 疡 (xz)9 CX) AA, (x) qu (x) RBH O, BELL rm/q'(*) 的 
TM 
X FÉ, uit (27 -1) 次 多 项 式 rm 除 以 9 (x) Bl" (x) ,. BB p(x) /q' (3) Ml px) 79" (x) 
的 余数 ， 而 不 是 通过 (2*“" -1) 次 多 项 式 p(x) BREL qg (a) M 9"(x) 得 到 余数 。 进 行 除法 本 身 
节省 一 些 时 间 。 但 是 ， 我 们 可 以 做 得 更 好 。 通 过 对 o HT A ABER cy, 6. oss cus 
可 以 保证 每 个 多 项 式 gw 存在 某 个 *， 使 之 具有 a^ -w 这 种 形式 。 除 以 这 种 形式 的 多 项 式 是 
非常 简单 的 。 
引 理 7.2 假设 ”=2，ow EEn 次 单位 根 。 对 于 0<j «2, Bl dhd d, , ] 是 整数 户 的 二 
进 制 表示 ，rev(j) 是 二 进 制 表示 为 [4 d, sd, ORE. BR c 是 or g = TIT (e), 


k-1 
© j= 2. 
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那么 Gin = x 一 o) o 


证 明 ; 通过 对 mm 进行 归纳 。 归 纳 基 础 m =0， 由 定义 go ox-c-x-o 可知， 结论 显然 成 
立 。 由 归纳 步 知 ， 当 m >0， 


Qm = dis 10127 9m-1 
= (am! Lamm) (x rt QUT D) 


其 中 L2" 是 一 个 从 0 -2 -1 之 间 的 偶数 ， 那 么 


rev( 1/277 1) 
w 


因为 =o = -1， 那 么 有 


= og tea =- [o7 77] 


_ 2 aevi) 027 rev(i/2") 
qm 7X -W =x -w 


Bs rev(20) = (Zreli) o B 


£i 7. 1 如 果 n =8， 列表 cy, Cis "ts Cy, Ew, o, o, e, o, o, e, wo gm 如 图 7-2 
所 示 。 


x*-o? 
x*—o? x*—o* 
XT xt—uy4 Xu? x—w* 


7-2. 对 引 理 7. 2 中 gi 的 说 明 


qm 用 来 求 余数 如 下 。 首 先 计 算 p(x)/(x* -ww ) pO ( - 9) ORC ry Are, Xp e 

式 p(x) - CLE 然后 计算 ro/ (3? -o)fÓ rm/ (x - o ) TA ry, Al ra, 以 及 ra/ (X - o )ff 

ro / GÀ -5) 的 余数 和 ra。 最后， 计算 ns. Tos Taos o Tor AP ro, A n E ru (x - e ) RI 

ra/ (x - o ) 的 余数 ， ro 和 ra 是 ra/ (x - c ) fI ra/ (x - e) HARK, 如 此 类 推 。 
”更 多 这 方面 的 例子 在 8. 5 节 中 。 


从 前 面 可 以 知道 ，q,, 有 x' -e 这 种 形式 现在 说 明 p(x) RU x’ -c 的 余数 是 很 容易 计算 的 。 
引 理 7.3 假设 


m 


HE e d&— MRM. WBA p(x)/(x' -e) 的 余数 为 


r(x) = Y. (a, + a, x 


jet 
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证 明 : 通过 观察 可 以 知道 ，p(x) 可 以 表示 为 : 


[ s.s] (x - c) *r(x) 


D» 
计算 任意 (2: -1) 次 多 项 式 除 以 x — c 的 余数 都 可 以 在 0,(i) 步 内 完成 ， 该 方法 比 任意 已 知 计 
算 (2t -1) 次 多 项 式 除 以 任意 :次 多 项 式 的 余数 都 快 。 
完整 的 FFT 算法 如 下 。 
算法 7. 1 快速 傅 里 叶 变 换 。 
输入 : 向 量 a= [a。，a,，…，a,1] ,其 中 n=2*， 且 上 为 整数 。 


输出 : 向 量 F(a) z[b, b,, Ut, bl’, Jt b; = X jas (O<i <n). 
方法 : 如 图 73 所 示 。 O 


let ry, be Izdaja; 
commemt 一 个 多 项 式 用 系数 表示 , 所 以 第 1 行 没有 涉及 计算 , 5 X 35d a xf sv 
limit, r RER: 
for m +- k — 1 step — 1 until 0 do 
for | + 0 step 27*! until n — 1 do 


let rims: be XI taxt; 
comment HAM rm+i 计 算 低 次 的 余数 
s = rev(l/2"); 


Fim (x) *- XE! (a; + way) x); 
Tural) — X E (a, wh Pay) x! 


end; 
for | — 0 until n — 1 do bn re 





图 7-3 快速 传 里 叶 变换 


为 了 修改 算法 7.1 来 计算 逆 变 换 ， 仅 通过 修改 第 6、7 行 中 o 的 指数 符号 ， 把 o 替换 为 w” ， 
然后 在 第 8 TPH ak Brevis) o 

例 7.2 假设 n=8， BAk=3, MF m=2, 83-7 的 循环 操作 只 有 当 ! =0 时 执行 。 在 第 4 
行 ， rw 为 .oox， 在 第 5 行 ，; 为 0， 在 第 6、7 行 有 

To = (a, *a,)x + (a, *a,) + (a, +a,)x * (ao *a,) 
fü 

Ty = (a, * 9a )x! + (a, * 'a,)x + (a, + w'a,)x + (ay + owa) 

对 于 m=1, ! 在 0~4 之 间 取 值 。 当 /=0 时 ,在 第 5 行 有 s=0。 这 样 在 执行 6、7 行 后 m = 
(a, +a, +a, *a,)x * (ay +a, +a, +a) 
和 

r4, = (a, + w'a, * a, + w'a,)x + (ay * a, * a, +w a) 
当 !=4 时 ， 计 算 *=2。 可 以 通过 第 6、7 两 行 和 上 面 的 公式 求 出 的 re 得 到 


2 4 6 2 4 6 
ry = (a, twa, +w a, to a,)x + (ay t oa, +t+wa +w a) 
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rg = (a, + wa, + w'a, + ea,)x + (ay + wa, + oa, +w a) 

最 后 ， 对 于 m=0, 1 取 值 0、2、4 和 6。 例如 ， 对 于 1=4， 有 s=1， 由 7 计算 得 到 : 

ro = 4 * 00, +a, +° +a, 

在 执行 到 第 8 行 的 for 循环 前 ，m 总 是 次 为 0 的 多 项 式 ， 也 就 是 常数 。 例 如 ， 当 1=4，rev(1) 
=1，rw 赋 值 为 5,。 对 于 5 的 这 个 公式 总 是 符合 5b, 的 定义 。 口 

下 面 证 明 算法 7. 1 的 正确 性 。 

定理 7. 3 算法 7.1 计算 离散 传 里 叶 变 换 。 

证 明 : 在 第 6 行 ，rm m ria ds 第 7 ÍT, Tis T Tos dias o 通过 使 用 引 理 7.2 和 7.3， 
很 容易 通过 对 ~m 归纳 证 明 EL" ox) 除 以 qn 的 余数 。 那 么 ,对 于 m=0， 引 理 7.3 保证 第 8 
行 的 for 循环 给 每 个 六 赋予 正确 的 (常量 ) 余 数 。 口 

定理 7.4 算法 7.1 需要 的 时 间 为 0,(n log mn) 。 

证 明 : 每 次 执行 第 6 行 和 第 7 行 需要 0,(2") 步 。 对 于 固定 的 m, 第 3 ~7 行 的 循环 迭代 
n/2" 次， 需要 的 总 时 间 与 m 无 关 ， 是 0,(n)。 从 第 2 行 开始 的 外 层 循环 总 共 执 行 i n 
次 ， 所 以 总 代价 是 0,(n log n) , 58 8 行 的 循环 实际 上 不 需要 算数 运算 。 

我 们 已 经 在 定理 7. 4 中 假设 ”是 固定 的 。 这 样 ,在 5 ~8 行 ,w 的 宪 、* 和 —À 
可 以 由 ?1 先 计算 ,在 执行 时 作为 常量 使 用 。 如 果 程 序 中 把 n 作为 一 个 参数 ， 那 么 仍旧 可 以 利 
用 0(n) 步 计算 出 w 的 赛 ， 并 把 它 存储 在 RAM 表 中 。 而 且 ， 即 使 需要 在 第 5 ~8 HER 
0O(logn) 步 由 ! 计算 * 和 rev(!1) ， 计 算 不 会 超过 3n 步 。 所 以 在 RAM 中 整个 算法 的 时 间 复 杂 
度 为 O(nlogn)。 

推论 1 可 以 在 0,(n log n) 步 内 计算 出 a@b， 其 中 a、b 是 长 度 为 n 的 向 量 。 

证 明 : 通过 定理 7.1、7.3 和 7.4 直接 可 以 得 到 。 口 

推论 2 可 以 在 0,(n log n) 步 内 计算 出 a、b 向 量 的 正 负 包 卷 积 。 

FFT 的 算法 7. 1 提供 了 算法 开发 的 直观 叙述 。 如 果 要 实际 计算 伟 里 叶 变 换 ， 那 么 只 需 对 其 系 
数 进行 处 理 ， 对 算法 进行 一 定 的 简化 。 具 体 的 工作 如 算法 7.2 中 所 示 。 

算法 7.2 简化 的 仿 里 叶 变 换算 法 (simplified FFT algorithm) 。 

A: 向 量 a=[a。，a,，…，a,.1] ,其 中 n=2* 且 上 为 整数 。 

输出 : 向 量 F(a) = [b b, oss b ul", 其 中 b= Xr sae" (0si«n), 

方法 : 利用 图 7-4 中 的 程序 。 为 了 概念 上 简化 ， 在 这 个 程序 中 用 临时 数组 S 存储 前 一 步 的 
值 。 实际 上 ,计算 在 原 地 完成 。 口 

第 3 行 第 一 次 执行 时 ， 多 项 式 p(x) = Ll aa 的 系数 存储 在 数组 $ 中 。 第 6 行 第 一 次 执行 
Bt, p(x) BREA x? -1 和 x”-w”， 余 数 分 别 为 ， 


> (a, * a,,2) X ay, (a, + oan) 


在 第 2 次 执行 第 3 行 时 ， 两 个 余数 的 系数 存储 在 数组 S 中 。 第 1 个 余数 的 系数 存储 在 数组 S 的 前 
半 部 分 ， 第 2 个 余数 的 系数 则 存储 在 数组 5 的 后 半 部 分 。 
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for i — 0 until 2* — 1 do R[i] + a; 
for | «- 0 until k — 1 do 
begin 


for i + 0 until 2* — 1 do S[i) + R [i]; 
for i — 0 until 2* — 1 do 
设 (ded, - - dy.) 是 整数 i 的 二 进 制 表示 ; 
R[(ds::: dil] — 
S[[d ` + © dici0di cc ded] 
十 egldt di-1--de--016 (d, dod 
end 


end; 
for i + 0 until 2* — 1 do 
buscas € Ride ^ + + del] 
end 





图 74 简化 的 传 里 时 变换 


对 第 6 行 的 第 二 次 执行 ， 两 个 余数 多 项 式 除 以 两 个 形 为 x” - w' 的 多 项 式 。 这 产生 了 4 
个 次 数 为 w4 - 1 的 余数 。 第 3 行 的 第 三 次 执行 把 这 四 个 余数 的 系数 存储 到 S 中 ， 其 余 类 
似 。 第 7 行 重新 对 结果 的 分 量 按照 正确 的 顺序 进行 重新 排列 。 在 计算 x -o MRAM, HT 
消去 又 乘 项 而 要 求 置换 单位 根 ， 所 以 这 一 行 操作 是 必需 的 。n = 8 的 部 分 过 程 在 图 7-5 中 进 
行 了 说 明 。 


bota a, +a; anta a +a, lo + tw atuwta a: twa, 


PEK DEKI 


ao + 4 a, +a, Do + 5 a, +a; 
tla, tag) ta tas) tule, ta.) tw lay +a) 


LIX X X 


+a, +a, ta, 
+ (a, +a, +a, tài) +w* (a, +8 *8, +a) 


图 7-5 通过 算法 7.2 计算 FFT 的 过 程 解释 。 因 为 缺少 空间 ， 省 略 了 一 些 余数 多 项 式 的 系数 
7.3 使 用 位 操作 的 FFT 


在 使 用 传 里 叶 变换 简化 卷 积 计算 的 应 用 中 ， 时 常 需要 确切 的 结果 。 如 果 计 算是 在 实数 环 上 ， 
那么 必须 把 实数 转换 成 精度 有 限 的 数 ， 导 致 了 错误 的 产生 。 这 些 错 误 可 以 通过 在 一 个 有 限 域 中 
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进行 计算 而 避免 >。 例 如， 为 了 计算 a=[a6, a, a, 0, 0]" fi bz [b, b, b, 0, 077 的 卷 
积 ， 可 以 令 2 作为 第 5 次 单位 根 应 用 于 计算 模 31。 然 后 变换 a 和 b， 执 行 两 两 相 乘 。 并 且 在 a@ 
b mod 31 计算 逆 变 换 的 精确 结果 。 使 用 有 限 域 的 困难 在 于 找到 一 个 合适 的 第 n 次 单位 根 的 域 。 
作为 替换 方法 ， 可 以 使 用 模 整数 严 的 环 R,， 选 择 m 值 使 环 存在 第 n 次 单位 根 w >。 对 于 给 定 的 
n， 并 不 能 马上 找到 o Am, 使 w 是 模 m 的 整数 环 的 第 次 单位 根 。 而 且 ， 也 不 能 把 m 定义 为 太 
大 的 值 ， 由 此 造成 模 m 计算 代价 的 增加 ， 而 不 被 允许 。 幸 运 的 是 ， 如 果 nn 是 2 的 矫 ， 那 么 存在 一 
个 合适 的 m， 近 似 为 2"。 特 别 是 定理 7.5 分 析 了 当 n 和 w(w>1) 都 是 2 的 赛 时 ， 可 以 通过 傅 里 时 
变换 、 分 量 乘法 (componentwise multiplication) 和 逆 变 换 在 模 为 (w” +1) 的 整数 环 中 计算 卷 积 。 首 
先 ， 引 理 7.4 和 7.5 将 给 出 预备 结果 。 在 这 些 引 理 中 ,假设 R=(S5，+ ，. ，0,1) 是 一 个 交换 
HR, 其 中 n=2:, k21, 
引 理 7.4 对 于 所 有 的 ae5， 


k+l 


Fa = IIa +’) 
证 明 : 对 上 进行 归纳 。 归纳 基础 =1 时 ， 结果 显然 现在 ， 观 察 下 式 
De = (1 +a) Gy (76) 
通过 规约 假设 和 把 。 代 换 为 a ， 可 以 得 到 
PO = [Iu «059 = LETS (7-7) 
利用 式 (7 7 了) 代替 式 (76) 的 右边 ， 归纳 假设 成 立 。 口 


引 理 7.5 假设 m=w”+1， Pwes, wz# 关 0。 那 么 对 于 1<p<n， 有 2 o* 508 m, 

证 明 : 通过 引 理 7.4 可 以 证 明 存 在 j (0<j ck), 14^ 0E m, 假设 p=2'p'， HH p' RA 
A, SEA Oxsck, HR], HBj+s=k-1, HA 1o* 2149" =1+(m-1)2。 但 是 (mm- 
1)= -1 模 m, Hup RAR, Br (m- 1) -1# m, XET jek-1-s, Leo 0m 
成 立 。 口 

定理 7.5 假设 n 和 w 是 2 X, m=0 +1, Ji RECO MHBRH, BAER, n 
有 一 个 乘法 逆 模 m( multiplicative inverse modulo m), Hw X —^4 X n 次 单位 根 。 

证 明 : Din 2 BE, mESK, MUA mn ES AE, n8 — "RESO mê, A 
H w#1, o=o wo =( -1)(-1) =1 (o7 +1). REAT. 5 中 可 以 得 出 w BRP 
一 个 主 n 次 单位 根 。 口 

定理 7. 5 的 重要 性 在 于 卷 积 定理 在 模 2” + !1 的 整数 环 上 是 有 效 的 。 如 果 希 望 计 算 两 个 n 维 
整数 向 量 的 卷 积 ， 并 且 卷 积 的 分 量 在 0 到 2”“ 之 间 ， 那 么 肯定 可 以 得 到 确切 的 答案 。 如 果 卷 积 的 
分 量 不 在 0 到 2” 之 间 ， 那 么 模 2”+1 是 正确 的 。 

现在 几乎 可 以 得 出 计算 卷 积 时 模 m 所 需要 的 位 操作 的 数目 。 首 先 考虑 在 计算 整数 模 m 的 余 
数 中 用 到 的 位 操作 的 数目 ， 这 是 从 模 m 的 算术 操 数 推出 位 操作 数 必 不 可 少 的 。 

假设 存在 整数 p 使 m=wr +1。 使 用 “ 除 9 余数 核对 ”( 以 9 除 得 到 的 余数 ， 再 以 相同 的 除法 ， 


O “Hye HL 12. 1 节 。 

日 ”当然 必须 确定 结果 元 素 在 0 ~ 30 之 间 ， 否 则 不 能 恢复 它们 。 通 常 ， 必 须 选 择 足 够 大 的 模 来 使 其 能 恢复 。 

© 目前 为 止 ， 如 果 把 o 当 作 复 数 e"*"， 并 且 像 在 复数 域 上 计算 一 样 ， 那 么 没有 误 和 歧途。 但 w 必须 当 作 整数 ， 
所 有 计算 必须 在 模 m 的 有 限 整 数 环 上 。 

O 该 结论 是 数论 的 基本 定理 。 在 8.8 节 中 ， 可 以 看 到 ， 如 果 a 和 互 质 ， 那 么 存在 整数 x 和 y, 使 r+by=1 成 
Sho RP arml Hb, 假设 b=m, afin 可 以 得 到 结论 。 
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以 9 除 之 。 一 一 译 者 注 ) 技 术 的 推广 来 计算 a 模 m 的 值 。 如 果 基 于 wr 记 法 ，a 可 以 表示 为 p 位 的 1 
HFI, WA at m 可 以 通过 交替 加 减 p 位 1 块 的 方法 进行 计算 。 

引 理 7.6 假设 m=w +1, 且 a= Xia", 其 中 对 于 每 个 i A0<a;,<w’, RA, a= 
Lial -1)' 模 m。 

证 明 ， 观察 w -1 im, 

TER: 引 理 7.6 中 的 ( 块 数 )! 固定 不 变 ， 那 么 计算 a 模 m 的 余数 可 以 通过 0, (plo) c 
作 实 现 。 

例 7.3 假设 n=4, »-2, m=2 +1。 那 么 在 引 理 7.6 P p =2。 考 虑 二 进 制 数 a = 101100。 
XE a, 200, a, 211, a, = 10。 我 们 可 以 计算 oo -oa +a, = -1， 然 后 加 m， 可 以 发 现 a=4 模 5。 
因为 ea 为 44， 所 以 结果 得 到 验证 。 口 

引 理 7. 6 提供 了 一 个 计算 a Em 的 有 效 方法 。 它 在 下 面 的 定理 中 起 到 了 非常 重要 的 作用 ， 
下 面 这 个 定理 给 出 了 在 计算 离散 傅 里 叶 变换 及 其 道 变换 计算 时 所 需要 的 位 操作 数 的 上 界 。 

定理 7.6 假设 w 和 nn 是 2 AE, m=w” +1, Bala, 2,75, 2,4) 是 整数 向 量 ， 对 于 每 
^i, HO<a,<m, Mla, a, c, a, 7 的 离散 传 里 叶 变 换 及 其 递 可 以 在 Os(mlog n log e) 步 
内 计算 模 m。 

证 明 : 利用 算法 7.1 或 者 7.2。 在 逆 变 换 中 ， 用 o 置换 w 并 且 用 ”… 乘 以 每 个 结果 。 整 数 
模 m 可 以 被 一 个 长 度 为 b= ((n/2)1og o) +1 位 的 字符 串 表示 。 由 于 m=2'”' +1, 模 m 的 余数 可 
以 通过 位 串 00---0 ~ 100…0 表示 。 

算法 7. 1 要 求 与 w HAE m 的 整数 加 法 和 模 m. 的 乘法 操作 。 这 些 操 作 执 行 O(n log n) 
次 。 利 用 引 理 7.6， 模 m 的 加 法 要 求 0,(0)3b, 其 中 56=((n/2) log o) +1。 因 为 w 是 2 BERE, 
所 以 乘 以 ow 等 于 左 移 plogw 位 ， 其 中 0<p <n。 得 到 的 整数 至 多 有 36 -2 位 ， 通过 引 理 7.6, 位 移 
和 计算 余数 要 求 0 (5) 步 。 如 此 ， 前 向 传 里 叶 变换 的 时 间 复 杂 度 为 O (bn log n)， 也 就 
fO, (n^ log nlogw)。 

XÉAREACECKRGREDA o Mn, BA owl Em, MUA e" mo "Bim, BARU o 8 
结果 和 乘 以 o" "得 到 的 结果 一 致 。 后 者 是 左 位 移 (m-pP)log o 位 ， 得 到 的 整数 至 多 36 -2 fr. A 
样 ， 利 用 引 理 7.6 可 以 在 0,(8) 步 内 得 到 余数 。 最 后 ， 考 虑 与 MR, UE n =2*， 那么 左 位 移 
n log w -大 位 ， 保 证 该 数 至 多 3 -2 位， 然 后 ， 通 过 引 理 7.6 计算 余数 。 这 样 ， 首 变换 也 要 
3RO,(n’ lognlogw) 步 。 m 

507.4 假设 w=2, n=4, m=5, X K[a,, a, a, a,]' 进行 傅 里 时 变换 ， 其 中 ai =i。 
由 于 对 所 有 的 ;， 有 as <5， 如 果 计 算 模 m， 期 望 恢复 这 个 向 量 。 用 三 位 来 表示 数 ， 除 了 临时 结 
JE, 只 有 000，…，100 会 实际 用 到 。 

在 算法 7.1 中 ， 必 须 计算 图 7-6 所 示 的 多 项 式 系数 ， 其 中 2 已 经 被 o 替换 了 。 


ao + d, + (a, + ag) ao + a, + 4(a, + as) GS + Aa, + 2(a, + 4ay) ay + 4a, + 8(a, + 4a,) 
9 da + a, + a; +a; = a, + 4a, + a, + 4a, = a, + 2a, + 4a, + 8a; = a + Ba, + 4a, + 2a, 
= bo = b, =b, w b, 





图 76 Zin-AB, 计算 快速 傅 里 叶 变 换 
图 7-6 中 的 实际 值 为 : 
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a, = 000 a, = 001 a, = 010 a, =011 
a, +a, =010 a, +a, = 100 a, +4a, =011 a, +4a, =011 
b, 2001 b, =011 b, 2100 b, z 010 


变换 [0，1, 2, 3] "是 [1, 4, 3, 2] E 5。 考 虑 最 后 一 行 的 最 后 一 个 元 素 b,。 它 由 中 间 行 的 最 后 
两 个 元 素 通 过 下 面 的 步 又 计算 得 到 。 


计算 a, +4a, 011 
向 左 移 三 位 ( 乘 以 8) 11000 
分 为 长 度 为 2 的 三 块 1 10 00 
把 第 一 块 和 第 三 块 相 加 ， 再 减 去 第 二 块 -1 
加 上 m=5 100 
加 上 a, +4a, =011 111 
MA m 010 


WE, PTLD) 27 58485, 44 HS 和 8 ”=2 模 5。 如 此 ， 逆 变换 公式 可 以 
从 图 7-6 中 通过 交换 a, 和 45. 以 及 2 和 8 得 到 。 计 算 过 程 如 下 : 


b, =001 b, 2100 b, x 011 b, 2010 
b, + b, 2100 b, +b, 2001 b, «4b, =011 b, +46, 2010 
4a, 2000 4a, =011 4a, = 100 4a, 2010 


最 后 ， 把 每 个 结果 除 以 4( 乘 以 4， 因 为 有 4 =4 模 5)， 可 以 由 [a。，a,，a,， a) 得 到 [0, 1, 
2, 3)". 口 

定理 7. 6 的 推论 BOM) ) 是 计算 两 个 上 位 整数 的 积 所 需要 的 步 数 。 假 设 a 和 b 是 长 
度 为 ”的 向 量 ， 且 该 向 量 的 整数 分 量 在 0 -o WEK, n 和 ww 是 2 的 矫 。 可 以 在 O,C MAXI miog 
nlog o, nM(nlog o) | ) 时 间 内 计算 a@b， 或 者 a 和 b 模 w+1 的 正 包 卷 积 或 负 包 卷 积 。 

定理 7.6 的 推论 中 函数 的 第 一 项 表示 变换 的 时 间 ， 第 二 项 表示 做 2n 次 (nlog w+1l) 位 整数 乘 
法 所 需要 的 代价 。 最 好 的 情况 下 ，M( 上 ) 的 值 可 以 是 hlog klog log k( 见 7.5 节 )。 在 这 种 情况 下 ， 
第 二 项 支配 第 一 项 ， 所 以 该 卷 积 操作 需要 O,(n’log nlog log nlog wlog log «log log log w) 步 。 


7.4 IR CER 
计算 两 个 一 元 多 项 式 的 乘积 问题 实际 上 和 计算 两 个 序列 数 的 卷 积 操作 相同 。 也 就 是 说 


2a 


( X) ( X) = XE He, = 20-5. 
和 前 面 的 一 样 ， 如 果 p <0 RE prn, RWA aM b BEKO, HE cx ,必须 为 0。 下 面 是 定理 7.4 
的 一 些 推论 。 
定理 7. 4 的 推论 3 两 个 n 次 多 项 式 乘积 的 系数 可 以 在 0, (n log n) 步 内 计算 得 到 。 
证 明 : 从 定理 7.4 的 推论 1 和 上 面 的 观察 可 以 直接 得 到 。 口 
定理 7. 4 的 推论 4 假设 可 以 在 M(i 步 内 计算 出 两 个 上 位 整数 的 乘积 ， 


p(x) = Yos fie) = yw 
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且 对 于 所 有 的 i 和 j，a, 和 bb 是 在 0 ~w”/Yn 之 间 的 整数 ， 其 中 和 w 22H, KA, 可 以 在 
Os,(MAX[n log n log o, nM(n log w) ]) 步 内 计算 p(x)gq(x) 的 系数 。 

证 明 : 从 定理 7.4 和 定理 7.6 的 推论 可 得 。 口 

注意 ， 在 推论 4 中 ,第 二 项 占 支配 位 置 。 

实际 上 ， 定 理 7.1 有 下 面 的 解释 。 假 设 p(x) 和 g(x) 是 (n -1) 次 多 项 式 。 在 2n -1 或 者 更 多 
AX p 和 g 计 值 ， 也 就 是 c。，c, ，…， 然 后 计算 P(c)4(e ) 的 值 获得 pg 在 这 些 点 上 的 值 。 唯 一 的 
(2n -2) 次 多 项 式 可 以 通过 这 些 点 插值 。 这 个 (2n -2) 次 多 项 式 就 是 pP(x) 和 94(x) 的 乘积 。 

当 把 传 里 叶 变 换 运用 于 卷 积 (或 者 等 价 的 多 项 式 乘法 ) 时 ， 选 择 C = w ， 其 中 w 是 主 2n 次 单 
位 根 。 计 算 p 和 9g 的 傅 里 叶 变换 ， 也 就 是 对 它们 在 ce 6, ，… 点 上 计 值 。 然 后 计算 变换 的 两 两 对 
应 乘积 ， 也 就 是 p(c) 和 4(c) 相 乘 得 到 c 的 值 。 接 着 ， 运 用 道 变换 计算 pg。 引 理 7. 1 保证 了 逆 变 
换 实际 上 是 一 个 插值 公式 。 也 就 是 说 ， 实 际 上 是 通过 在 w, w, coo, o 这些 点 上 的 值 恢 复 多 
项 式 。 


7.5  Schónhage-Strassen 整数 相 乘 算法 


现在 转 到 卷 积 定 理 的 一 个 重要 应 用 ， 快 速 按 位 整数 乘法 算法 (a fast bitwise integer ~ multiplica- 
tion algorithm) 。 在 2. 6 节 中 介绍 到 了 如 何 通过 把 两 个 n 位 二 进 制 整数 中 的 每 一 个 分 为 两 个 (n/2) 
位 整数 在 O( n" ) 步 内 计算 它们 的 乘积 。 这 个 方法 可 以 推广 为 把 每 个 整数 分 为 6 块 1 位 的 数 。 通 
过 把 8 块 当做 多 项 式 的 系数 可 以 对 式 (2-4) 中 的 表达 式 进行 类 似 的 改进 。 为 了 找到 多 项 式 乘 积 的 
系数 ， 通 过 对 某 个 合适 的 点 集 、 乘 以 样本 值 和 插值 来 计算 多 项 式 。 通 过 选择 主 单位 根 为 计 值 点 ， 
可 以 利用 傅 里 叶 变换 和 卷 积 定理 。 通 过 假设 为 一 个 = 的 递归 函数 ， 可 以 在 O(n log n log log n) 
步 内 计算 出 两 个 n” 位 数 的 乘法 。 

为 了 简化 讨论 ， 把 二 限制 为 2 WE. HF 不 是 2 的 午 的 情况 ， 可 以 通过 加 上 合适 数量 的 前 
FO, [E18 n A 2 的 敌 ( 这 仅 增 加 了 常数 因子 )。 更 进一步 ， 我 们 将 计算 两 个 位 整数 模 (2" + 1 ) 
的 乘积 。 为 了 得 到 两 个 位 整数 准确 的 乘积 ， 必 须 引 入 前 导 0 和 2n 位 整数 模 (2”+ 1) 乘 法 ， 从 
而 再 次 由 于 常量 因子 增加 了 需要 的 时 间 。 

假设 w Alo 是 要 进行 模 (2" + 1) 乘 法 的 0 ~ 2n 之 间 的 二 进 制 整数 。 通 过 观察 可 知 ， 在 二 进 制 
表示 中 ，2" 需 要 n+1 位 。 如 果 z 或 者 v SF 2", 那么 用 一 个 特殊 符号 -1 来 表示 ， 这 种 情况 下 的 
乘法 操作 很 容易 作为 一 个 特例 处 理 。 如 果 =2"， 那么 w 模 (2" +1) 可 以 通过 计算 (2" +1 - 0) BE 
(2° +1) 得 到 。 

假设 n=2*， 且 当 上 为 偶数 时 5=2”， 其 他 情况 下 5=2*-??。 假 设 1=n/b。 观 察 1b Mb 除 
以 i。 第 一 步 是 把 wu 和 vw 分 为 b 块 ， 每 块 大 小 为 1 位 。 如 此 


uzuj 2^" 4 +2 su, 
5n 
v 24427 4. v2 + 20 
u Fl v 的 乘积 由 下 式 得 到 
uv = yy 207 4 + 2 + y, (7-8) 
其 中 


y; = Y uv <i < 2b 
CMF «0X3 j»b-1, W u, =v, 20, 项 yu- 为 0， 仅 是 为 了 满足 对 称 。) 
乘积 w 可 以 通过 卷 积 定理 计算 。 利 用 傅 里 时 变换 乘法 ( multiplying the fourier transforms) 需要 
2b 次 乘法 操作 。 使 用 卷 积 可 以 把 乘法 操作 的 次 数 减 少 到 1。 原因 在 于 我 们 是 在 模 2" +1 下 计算 w 
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的 。 因 为 如 =n， 所 以 有 2"= - 148 (2^ +1)。 这 样 ， 通 过 式 (7-8) 和 引 理 76， 计 算 ue 模 (2" + 
DX 
up = (w, 20°" 4e w,2' + wy) 横 (2" +1) 

其 中 ， ii 二] Oxi«b, 

由 于 两 个 ! 位 数 的 乘积 必定 少 于 2 ， 由 于 思 和 7 加, 分别 是 i+1 和 8- (i+1) 位 这 类 乘积 的 和 ， 
v, 2 y, - y, IE - (b -1 -i)2” <w, c (i+1)2” 范 围 内 。 如 此 ，w, 总 共有 最 多 b2*" 种 可 能 的 取 
值 。 如 果 能 够 计算 w, 模 所" ， 那 么 通过 加 上 bw, 和 适当 的 位 移 就 可 以 在 0( blog( b2”) ) 额外 步 内 计 
Ah uw Q1). 

为 了 计算 wi 02", 计算 w, 两 次 。 一 次 是 模 5， 还 有 一 次 是 模 2” +1, Bw, Bw Mb, w, 
是 w 模 (2* +1)。 因 为 b 是 2 BE, 2" +1 是 奇数 ,b 和 22” +1 互 质 。 所 以 w, 可 以 由 w; 和 w; 通过 
如 下 公式 计算 。 

w, = (27 & 1) ((w, - w;) Hb) +w? 

wfg(b -1 一 让 2 和 (i+1)2* 之 间 。 对 于 每 个 w,， 从 w, 和 wi 计算 w; 需要 0(1+logb) ， 总 的 需要 
时 间 为 OC + blogh) RÆ 0(n)。 

通过 设置 =u HE D, v; =, Bb, 计算 w, 模 4b 的 值 ， 并且 生成 两 个 (36 log b) AML MS 
如 图 7-7。 利 用 第 2.6 节 中 的 算法 计算 积 总 需要 至 多 0( (3b log 5)") 步 ， 也 就 是 少 于 0(n) 步 。 
TURA io = X^ y209", Hey’ = Dale) HUP y, <2, BEI y, 可 以 很 容易 地 从 中 
AR. wH b 的 值 可 以 通过 计算 (y, -yy,,,) 模 4&8 找到 。 





图 7-7 在 计算 w, 模 5 中 用 到 的 复数 。 每 一 0 块 中 都 有 2logb 个 0 


HES w 模 上 后， 通过 包 卷 积 计算 w, 模 2”+ 1。 这 涉及 傅 里 时 变换 、 两 两 相 乘 和 逆 变 换 。 假 
d ez2'", m=27 +1, BEH7.5, w FI b A m HRW ( multiplicative inverses modulo m) , w 
BELKA. db, E y 22" iE (p E 2b 次 单位 根 )， Lu, wu, cn. ^ uu] OS, 
do, ,由 v1] 的 负 包 卷 积 是 : 

[GO ~ xD n = ue Ona 模 2” +1， 

其 中 y= Dou, ((0sis2b - 1), wA 2" +1 可 以 通过 恰当 的 位 移 操作 得 到 。 完 整 的 算法 概括 
如 下 。 

算法 7. 3  Schönhage-Strassen 整数 乘法 算法 。 

BA: 两 个 n 位 整数 ww 和 vw， 其 中 =2'。 

给 出: (n+1) 位 的 vv Mv M2" +1 KH, 

方法 : 如 果 n 很 小 ， 那 么 可 以 挑选 所 喜欢 的 算法 来 计算 w MoR +1) HRB, Yn RK 
时 ， 如 果 k ERANG b=2”， 其 他 情况 则 令 5 = 24 252。 假设 ! = nb。 表 达 式 二 = E'u", 
v= Zuo2， 其 中 心 和 2 是 介 于 0 ~2' -1 之 间 的 整数 (也 就 是 说 上 是 z 的 ?位 长 度 的 块 ,w 是 v 的 
i 位 长 度 的 块 ) 。 


O 如 果 p1 和 ps 是 互 质 的 ， w=g Wp, wag Wp, H0Sw<pp, N w=p (p S pi) (qi -ai p) +n. B 
Wp, =5 并 且 ps =2% +1。 由 于 6b 是 2 REH”, b BRU, 382,27 +1 HE b REE 1, 





aa 
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1. 计算 模 2”+1 AL, dns, c0. wa] Alo, dm, oo, d vu]. 的 傅 里 叶 变换 ， 
REP y 22^, y b 次 单位 根 。 

2. 使 用 递归 计算 每 两 两 乘积 的 算法 7.3 计算 步 1 中 模 2”+ 1 的 传 里 叶 变 换 的 两 两 乘积 。( 在 
这 里 把 2” 当 作 特 例 来 容易 地 处 理 。) 

3. 对 第 2 步 中 两 两 相 乘 的 向 量 计算 模 2” + 1 的 传 里 叶 逆 变 换 。 这 个 计算 结果 是 [io ，yno ，…， 
wa] S2 41, Hep wala, uy, +, uu] Ally, son. aul 负 包 卷 积 的 第 ;项 。 通 
it ^w, 和 由 “' 相 乘 模 2*” +1 可 以 计算 出 w; =w, 模 2* +1。 

4. 按 如 下 方式 计算 w, = wimodb: 

a) [Bit u, =u, SE b, v v, Bb, HrpOsicb; 

b) it HB ow. v, 和 插入 2 log b 4- 0 SE Hi Cu Md, BME = Xi v2 Mo = 
Xie209", 

c) 利 用 2.6 节 中 的 算法 计算 积 uv; 

d) 乘 积 to = Y7,y27. XB y = Xv uojo w Bo 的 值 可 以 通过 计算 w= (7 73,0) 
BbUM, 其 中 0<i<b; 

5. 用 下 面 的 公式 准确 计算 w, Hp wl -1 -让 2 和 (i+1)2” 之 间 ; 

w, = (2% +1)((w - w;) Eb) +w, 

6. iK X w2 HE (2^ «1) ， 这 是 期 望 的 结果 。 口 

定理 7.7 算法 7.3 计算 w 模 (2" +1) 的 值 。 

证 明 : 由 定理 7.2, 算法 7.3 的 第 1 步 到 第 3 步 正确 地 计算 了 w, 模 2”+1 的 值 。 作 为 练习 ， 
读者 可 自行 证 明 算 法 的 第 4 步 计算 w 模 的 值 ， 第 5 步 计算 w 模 5b(2”+1)， 即 确切 的 w, 值 。 口 

定理 7.8 算法 7.3 所 需要 的 执行 时 间 为 O,(n log n log log n) #} 

证 明 ; 由 定理 7.6 的 推论 可 知 ， 第 1 步 到 第 3 步 需 要 的 时 间 为 Ol bl log b + bM(21) ] ， 其 中 
M( m) 是 通过 算法 的 递归 应 用 计算 两 个 m 位 整数 相 乘 所 需要 的 时 间 。 在 第 4 步 ， 构 造 长 度 为 35 
log b Aù MD, HEHE OL (35 log 8)"”] 步 内 计算 出 乘积 。 在 6 足够 大 时 ，(36 log b) P <b, W 
以 第 4 步 所 需要 的 时 间 可 以 在 第 1 到 第 3 步 中 的 O,( 6? log 5) 项 下 忽略 不 计 。 第 5、6 步 都 只 需要 
0(n) 时 间 ， 所 以 也 可 以 忽略 。 

因为 n=& 且 4b 最 大 为 Vn， 所 以 ， 可 以 得 到 递 推 公式 如 下 


M(n) x cn log n + bM(21) (7-9) 
对 于 常量 和 足够 大 的 nm， 假 设 M'(n) 2 M(n)/n, BAK(7-9) ER 
M'(n) <c logn + 2M'(21) (7-10) 
又 因为 1<2 Jn, 
M'(n) clog n + 2M'(4 Jn) (7-11) 


HFA c, RAAME M (n) «c' logn log log na。 在 这 里 ， 在 式 (7-11) 中 把 M'(4 Yn) 置换 为 
c' log (4 Vn)log log 4Vn。 直 接 相 乘 可 得 
M'(n) €clogn + 4c'log(2 + Y log n)+ c’ log n log (2 + Y log n) 


对 于 大 的 m，2 + -Jog n< 2-log n。 由 此 


M'(n) Sc log n +4c'log + + 4c'log log n +c’ log Zilog n + c'log nlog logn (7-12) 
对 比较 大 的 n 和 足够 大 的 ce ， 前 四 项 可 被 负 的 第 四 项 消去 。 所 以 式 (7-12 ) 简 化 为 M'(n) <c'logn 
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log log nm。 从 这 里 可 以 总 结 出 结论 M(n) scn log nlog log no Li 
习题 


7.1 ”在 复数 环 中 ， 当 n=3, 4, 56, HE n 次 单位 根 是 什么 ? 
7.2 “不 使 用 临时 数组 $5， 试 描述 算法 7.2 如 何 实现 。 
7.3 “利用 下 面 序列 计算 复数 环 下 的 离散 傅 里 叶 变 换 。 
a)[0, 1, 2, 3] 
b)[1, 2, 0, 2, 0, 0, 0, 1] * 
7.4 Hn ARWR, HE RABE ERE, 
定义 Who fn E EE IRE, OER m 整数 环 的 主 n XE DRIN, XX 06 (o, n, 
m) 称 为 是 可 接纳 的 (admissible) 。 
7.5 “下面 哪 个 三 元 组 是 可 接纳 的 。 
a) (3, 4, 5) 
b)(2, 6, 21) 
c)(2, 6, 7) 
7.6 ”证 明 ， 如 果 三 元 组 (w，n，m) 是 可 接纳 的 ， BAM i <p<naW, w"=1 模 m 并 且 o^ El, 
*7.7 WH, Wisin 22, =m, 22-1 Am HIR, 其 中 1<p<n, 那么 (2, n, m) 
可 接纳 的 三 元 组 。 
**7.8 证明， 如 果 普 是 质数 并 且 o REOR, SEL ETE n, 使 (ww，n，m) 是 可 接纳 的 三 元 组 。 | 
*7.9 ”证 明 ， 如 果 a 和 5 互 质 ， 那么 存在 c 使 ac=1 模 5。 同 时 逆 命 题 也 成 立 。 证 明 模 5 下 c 是 唯 | 
一 的 。 
7.10 计算 (10101110011110), 模 25 +1, 
7.11 假设 上 是 以 10 为 基 的 整数 。 证 明 将 上 的 各 位 数字 相 加 ， 然 后 将 结果 的 各 位 数字 相 加 ， 如 此 
下 去 ， 直 到 剩 下 一 位 数字 ， 此 时 结果 等 于 上 模 9。 
7.12 ”使 用 卷 积 定理 和 可 接纳 三 元 组 (2，8，17) 计算 序列 [1，2，3，4]j 和 [4,， 3, 2, 1] 17 的 
卷 积 。 
7.13. 利用 算法 7.3 计算 二 进 制 数 (1011011 ), 和 (10001111) ,的 乘积 。 | 
7.14 证 明 : XJ n 22 RET loglogn 次 得 到 的 结果 是 2。 | 
*7.15 利用 卷 积 而 不 是 包 卷 积 设 计 一 个 快速 整数 乘法 算法 。 分 析 算 法 的 近似 运行 时 间 。 
*7.16 序列 a=[oo，cj，…，a, ,]' 的 循环 差分 (cyclic difference) 表 示 为 Aa， 是 序列 [av -a,_,， 
aiao, 0,-0,, *7, 0, , -a, 3]'e 假设 F(a) =[a,, ay, a'. io 证 明 F(Aa) = [0， 
a,(1-w), a, (1-0), =, a', (1-9 )], Bho Èn ke, 
林 7. 17 利用 习题 7. 16 的 结果 证 明 ， 如 果 X(n) -X(n-1) =n 81 X(0) 20, AKA X(n) 2n(n« 
1)/2, 
*7.18 循环 行列 式 是 一 个 矩阵 ， 该 矩阵 的 每 一 行 都 是 上 面 一 行 元 素 向 右 位 移 一 个 单位 。 例 如 ， 


a b c 
| a 1 
bc a 


是 一 个 3 x3 循环 行列 式 。 证 明 ， 计 算 长 度 为 上 的 向 量 的 离散 傅 里 叶 变换 等 价 于 (m -1) x 
(-1) 循 环行 列 式 相 乘 ， 其 中 路 是 质数 。 
总 7.19 证 明 有 限 域 上 的 有 限 传 里 叶 变 换 可 以 在 O, (n log n) 步 内 计算 得 到 ， 其 中 n 是 质数 。 
*7.20 思考 通过 每 一 点 上 的 导数 的 值 表示 一 个 多 项 式 ， 是 否 从 系数 到 导数 的 值 变换 是 线性 的 ? 
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87.21. 根据 多 项 式 操作 给 卷 积 一 个 “物理 "定义 。 
*7.22 利用 快速 传 里 叶 变 换 编写 一 个 算法 在 0(n log n) 时 间 内 计算 出 特 普 利 蒋 矩 阵 和 向 量 的 乘 
积 。 把 解决 方法 和 习题 6. 26(b) 相 对 比 。 


研究 性 练习 题 


7.23 寻找 一 个 整数 相 乘 或 者 离散 傅 里 叶 变换 的 快速 算法 。 证 明 在 一 定 模 型 的 限制 下 ， 
Schinhage-Strassen 算法 或 者 快速 傅 里 叶 变 换 是 最 好 的 。 在 特定 的 约束 下，Paterson， 
Fischer 和 Meyer[ 1974 HEBA RÆ O, ( (n log n)/(loglog n) ) 时 间 就 可 以 实现 按 位 整数 
乘法 。 类 似 ，Morgenstem[ 1973 ] 说 明了 在 特定 的 限制 条 件 下 ， 离 散 传 里 叶 变换 需要 
O, (n log nm) 时间。 


文献 与 注释 


Cooley, Lewis 和 Welch [1967 ] 对 快速 傅 里 叶 变 换 的 研究 是 在 Runge 和 Konig [ 1924 ] 的 基础 
上 进行 的 。 这 个 技术 被 Danielson 和 Lanczos [1942] 和 Good [ 1958 ，1960] 应 用 过 。Cooley 和 Tukey 
[1965 ] 基础 论文 基本 上 清晰 描述 了 该 技术 的 本 质 。 把 FFT 技术 发 扬 用 到 多 项 式 除法 ， 主 要 归功 
于 Fiduccia [1972] 。 由 于 在 计算 上 的 重要 性 ， 大 量 的 注意 力 吸 引 到 有 效 实 现 的 算法 上 。 例 如 
Gentleman 和 Sande[ 1966 ] 以 及 Rabiner 和 Rader[ 1972 ] 的 许多 文章 都 是 有 关 这 方面 的 。 整 数 乘法 
算法 由 Schónhage 和 Strassen ( 1971] 提出。 习题 7.18 和 7. 19 取 自 Rader [1968 ] 。 





第 8 章 整数 与 多 项 式 计 算 


把 整数 和 多 项 式 计算 合 在 一 起 讲 的 主要 原因 在 于 大 多 数 处 理 整数 和 一 元 多 项 式 的 算法 在 本 
质 上 是 相同 的 。 不 仅 是 乘法 和 路 法 ， 还 有 更 复杂 的 操作 也 很 相似 。 例 如 ， 求 一 个 整数 模 第 二 个 整 
数 的 余数 的 运算 等 同 于 对 多 项 式 在 某 一 点 求 值 。 利 用 余数 表示 一 个 整数 的 方法 等 同 于 用 一 些 点 
的 值 来 表示 多 项 式 。 从 余数 构造 一 个 整数 的 过 程 (“中 国 剩余 定理 ”) 等 价 于 插值 一 个 多 项 式 。 

本 章 将 介绍 一 些 特定 的 整数 和 多 项 式 操作 ， 例 如 与 乘法 操作 具有 相同 时 间 复 杂 度 要 求 的 除 
法 和 开 方 运算 。 其 他 操作 如 上 面 提 到 的 余数 操作 或 计算 最 大 公 因 子 操 作 ， 这 些 操 作 需 要 至 多 比 
乘法 操作 多 一 个 logn 因子 的 时 间 ， 其 中 是 用 二 进 制 整数 的 长 度 或 者 多 项 式 的 次 数 。 本 章 对 整 
数 和 多 项 式 的 叙述 是 交替 进行 的 ， 通 常 只 证 明 其 中 一 种 情况 ， 另 外 一 种 则 留 作 练 习 。 和 其 他 章 一 
样 ， 重 点 在 于 提供 与 目前 已 知 最 好 的 相 接近 的 算法 。 

本 章 最 后 将 简要 讨论 大 部 分 系数 不 为 零 的 多 项 式 ( 稠密 多 项 式 ) 和 大 多 数 系数 为 零 的 多 项 式 
〈 稀 朴 多 项 式 ) 模 型 之 间 的 区 别 。 在 处 理 拥 有 许多 变量 的 多 项 式 (本 书 中 不 讨论 这 种 情况 ) 时 ， 稀 
BUSTWAE UR H. 


8.1 整数 和 多 项 式 的 相似 性 


非 负 整 数 和 一 元 多 项 式 之 间 最 明显 的 相似 性 在 于 它们 都 可 以 表示 为 有 限 的 寡 数 列 ， au 。 
对 于 整数 而 言 ， 如 果 * =2， 那 么 a 可 以 从 集合 10，11 中 取 值 。 对 于 多 项 式 而 言 ， 如 果 x 不 确定 ， 
那么 a 可 以 从 菜系 数 集 ? 中 取 值 。 

表示 整数 或 多 项 式 的 笑 数 列 长 度 基本 上 是 自然 的 “规模 "衡量 尺度 。 对 于 二 进 制 整数 而 言 ， 
尺度 是 表示 该 整数 需要 的 位 数 ; 对 于 多 项 式 而 言 ， 是 多 项 式 的 系数 的 个 数 。 有 如 下 定义 。 

定义 如 果 i 是 一 个 非 负 整 数 ， 那 么 SIZE(i) =Llogij+1。 如 果 Pp(x) 是 一 个 多 项 式 ， 那 么 
SIZE(p) =DEG(p) +1， 其 中 DEG(p) 是 p 的 次 数 ， 即 系数 非 零 的 x HRB, 

对 于 整数 和 多 项 式 ， 可 以 进行 类 似 的 划分 。 如 果 a Ab 是 两 个 整数 ， 且 8 0, RARE 
一 的 一 对 整数 9 Ar, WE 

l.a=bg+r, A 

2.r«b 

其 中 g 和 和 rf 分 别 是 a 除 以 6 的 商 和 余数 。 

类 似 地 ， 如 果 a 和 是 两 个 多 项 式 ， 且 “不 是 常量 ， 那 么 存在 唯一 的 9 和 7 多 项 式 满足 

la-bq*r, H 

2. DEG(r) < DEG(b) , 

整数 和 多 项 式 之 间 另 一 个 相似 性 是 它们 都 存在 非常 快速 的 乘法 算法 。 上 一 章 讨 论 了 两 个 具 
有 实数 系数 的 n 次 多 项 式 可 以 通过 使 用 FFT 在 0, (n log n) 时 间 内 实现 乘法 操作 。 因 为 在 实际 应 
用 中 ,使 用 多 项 式 的 固定 精度 的 系数 表示 多 项 式 ， 并 且 通 过 系数 的 算术 操作 来 实现 各 种 多 项 式 
操作 ， 所 以 算术 操作 的 复杂 性 计算 是 合理 的 。 


O 在 后 面 ， 可 以 认为 系数 集 是 实数 域 ( 见 12. 1 节 ) ， 由 于 算法 复杂 性 的 计算 是 根据 系数 域 上 的 操作 次 数 而 定 的 ， 
本 章 的 结果 可 以 应 用 于 任何 域 。 由 此 ， 不 必 考 虑 模型 中 的 系数 大 小 。 





EHS ZRAUSH 171 


如 果 使 用 7.5 节 中 的 Schonhage-Strassen 算法 ,那么 两 个 mn 位 整数 乘法 可 以 在 
0s《nlognloglogn) 时 间 内 完成 。 对 于 整数 而 言 ， 位 操作 的 次 数 是 考虑 算法 复杂 度 时 唯一 感 兴趣 的 
量度 。 在 以 下 两 种 情况 下 都 不 把 整数 乘法 当 作 原 语 操 作 。 第 一 ， 在 设计 乘法 操作 硬件 时 ， 位 操作 
次 数 反映 一 个 乘法 周期 需要 的 元 素数 量 ; 第 二 ， 在 为 定 长 字 计 算 机 设计 定点 的 任意 精度 算法 时 。 
如 在 进行 ”位 精度 乘法 时 ， 位 操作 次 数 和 所 需 的 机 器 指令 数目 是 相关 的 。 

如 此 ， 对 于 所 用 的 两 种 不 同 的 复杂 度 (算术 和 位 )， 多 项 式 和 整数 算术 计算 的 结果 将 显示 出 
很 高 的 相似 性 。 进 一 步 讲 ， 用 筹 数列 表示 整数 时 ， 位 操作 就 是 系数 操作 ， 对 多 项 式 而 言 ， 算 术 操 
作 也 是 系数 操作 ， 两 种 量度 是 很 相似 的 。 


8.2 整数 的 乘法 和 除法 


下 面 讨论 位 操作 的 整数 乘法 需要 的 时 间 和 整数 除法 需要 的 时 间 只 差 一 个 常数 因子 ， 近 似 于 
整数 开 方 和 求 倒数 需要 的 时 间 。 本 节 将 用 到 的 四 个 符号 及 其 解释 如 下 : 


符号 含义 

M(n) 长 度 为 ”的 两 个 整数 乘法 需要 的 时 间 

D(n) 长 度 小 于 2n. 的 整数 除 以 长 度 为 = 的 整数 需要 的 时 间 
S(n) KEK n 的 整数 开 方 需要 的 时 间 

R(n) KEX n 的 整数 求 倒数 需要 的 时 间 


每 一 种 情况 下 ， 需 要 的 时 间 以 位 操作 为 单位 。 同 时 合理 地 假设 M(n) 满 足 如 下 条 件 : 
a’M(n) = M(an) > aM(n) 

其 中 ez>1。 其 他 三 个 函数 也 满足 。 

首先 证 明 n 位 整数 ; 的 倒数 可 以 在 两 个 ”位 整数 相 乘 需要 的 时 间 内 计算 完 。 因 为 1 在 ;>1 
时 的 结果 不 是 一 个 整数 ， 所 以 求 i 的 “倒数 ”的 真正 含义 是 求 副 近 分 数 1/189 n 位 有 效 值 。 由 于 假 
设 比 例 的 改变 ( 二进制 小 数 点 的 位 移 ) 不 花费 时 间 ， 因 此 可 以 说 i 的 “倒数 "等同 于 2”"' 除 以 i 的 
商 。 在 本 节 的 剩余 部 分 用 项 的 倒数 (term reciprocal) 表示 这 种 含义 。 

首先 考虑 为 数 4 =1/P FRSA, RP PBPK. BRA, 是 对 1/P 的 第 i 个 通 
近 。 那 么 4 的 确切 值 可 以 表示 为 


A = A, + (1/P)(1 - A,P) (8-1) 
如 果 用 式 (8-1) 中 的 4, BG 1/P， 可 以 得 到 
Ain = A, * A(1- AP) = 2A, - AP (8-2) 
该 选 代 公式 可 以 根据 第 ; 个 逼近 计算 出 第 (i+1) 个 逼近 。 注 意 ， 如 果 4P=1 -S$， 那么 
AnP = 2A4P - AP 22(1-8) -(3- S! =1-3 


这 说 明了 迭代 公式 (8-2 ) 是 二 倍 收敛 的 ( converge quadratically) 。 如 果 ss 六， 那么 每 次 迭代 得 到 


的 正确 位 数 是 双 倍增 长 的 。 

由 于 PP 可 能 有 许多 位 ， 所 以 没有 必要 把 P 的 所 有 位 用 在 早期 的 逼近 中 。 因 为 只 有 PP 的 前 导 
fit (leading bit) 会 影响 正确 计算 正确 的 4,,, 位 。 进 一 步 ， 如 果 4,,, 到 小 数 点 右边 的 头 上 位 是 正确 
的 ， 那 么 利用 公式 (8-2) 可 以 得 到 4,,, 的 头 站 位 。 也 就 是 说 计算 4 =24, - ATP 时 ，24, 截 取 小 数 
点 右边 的 大 位 , APR PH 2k t, 然后 对 得 到 的 结果 在 小 数 点 右边 2k 位 置 截断 。 因 为 在 前 面 候 
设 PP 是 确切 的 ， 所 以 最 后 得 到 的 近似 值 肯定 影响 收敛 性 。 

下 面 的 算法 中 将 用 到 这 个 思想 。 实 际 计 算 | 2”-'/P | 的 商 ， 其 中 =p,p,…p, 是 一 个 位 整 
数 ， 且 p, =1。 使 用 的 方法 本 质 上 就 是 公式 (82) ， 引 人 比例 (scaling) 能够 对 整数 进行 专门 处 理 。 
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因此 ， 没 有 必要 保持 小 数 点 。 

算法 8.1 求 整数 的 倒数 。 

输入 : n 位 整数 P=[p,p,…p,]， 其 中 p, =1。 为 了 叙述 方便 , 假设 n 是 2 的 者 ， 并 且 [x] 是 
TI EB x 所 表示 的 整数 (例如 [110] =6)。 

输出 : 整数 4=[aoa…a,] ,满足 4= [2^7 7P], 

方法 : 调用 RECIPROCAL( [pip,…p,] )， 其 中 RECIPROCAL 是 图 8-1 中 的 递归 过 程 。 对 于 2 
的 任意 次 寡 上 ， 该 过 程 计算 L2”…/[pip…Ppi]j 的 逼近 值 。 除 了 己 是 2 的 寡 的 结果 是 上 + 1 位 整数 
外 ， 其 他 结果 都 是 一 个 普通 的 上 位 整数 。 

给 定 一 个 位 [pip,…pi 的 倒数 ， 第 2 ~4 行 计算 2k -3 位 [pp,…py ] 的 倒数 。 第 5 ~7 行 校 
正 最 后 三 位 。 实 际 上 可 以 跳 过 5 ~7 行 ， 最 后 通过 对 公式 (8-2) 的 应 用 可 以 得 到 想 要 的 准确 性 。 为 
了 简化 对 算法 的 理解 ， 并 且 证 明 算 法 确实 有 效 ， 选 择 包含 第 5 ~7 行 的 循环 。 口 

例 8.1 计算 25/153。 这 里 用 

n=8 和 153 = [p,p,:-p,] = [10011001] 
调用 
RECIPROCAL( [ 10011001 ] ) 

递归 地 按 顺 序 调 用 RECIPROCAL， 分别 使 用 参数 [1001] ，[10] 和 [1]。 在 第 1 行 得 到 RE- 
CIPROCAL([1]) =[10], 在 第 2 行 返 回 RECIPROCAL([10])， 其 间 设 置 [coc, ] 一 [10] 。 然 后 在 
第 3 行 , iP d, d,]—[10] «2! - [10]? + [10] =[1000]。 接 下 去 在 第 4 行 设 [aoaia,] 为 
[100], 在 5 ~7 行 的 循环 中 没有 变化 。 返 回 到 RECIPROCAL([1001]) , J£rp [100] Æ 27/10] 4) 
近似 值 。 

返回 第 2 行 ， 当 k=4 时 ， 有 [eocics] =[100]。 那 么 [di…ds] = [01110000] A[a,---a,] = 
[01110]。 这 次 在 第 5 -7 行 的 循环 中 仍旧 没有 变化 。 返 回 第 2 行 的 RECIPROCAL([ 10011001] , 
且 [eo…es] =[01110] ， 那 么 

[d,---d,,] = [0110101011011100] 
REER AIT, [aa] = [011010101], E986 fp, 33[0110101017 * [10011001] 是 十 进 制 
的 213 * 1353， 它 的 值 为 32589 mi 2° =32768。 这 样 在 第 5 ~ 7 行 的 循环 中 ，1 被 加 到 213 上 ， 得 
到 214， 或 者 是 二 进 制 的 [011010110] 。 口 





procedure RECIPROCAL([p,p, + - - p]: 
1. if k = 1 then return [10] 





else 
begin 
2. [caci ^ ^ * Can] 二 RECIPROCAL([pyp © tt * Dead); 
3. [d d day] € NM ` Er .2* 
[ccs ttt Cen]? * 


comment BADIA ERE -个 Qk 1) BER 
实际 上 头 [(2k + Dst] 位 总 是 0; 
4. [ai > + c ax) © (dids c desi]; 
comment [a42,:: + ay] E 2? !/[psps > > > p] 非常 好 的 近 
似 值 。 下 面 的 循环 在 必要 的 情况 下 通过 加 入 最 后 三 位 
提高 逼近 程度 。 
for i + 2 step — 1 until 0 do 
if ({aga, + - ax} + 2') * (pips ^ cc py] s 27? then 


[a0 ^: ax] + [aoa > - © ay) + 2%, 
return [aoa, > + > ax] 


5. 
6. 
7. 
8. 








图 8-1 计算 整数 倒数 的 过 程 
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定理 8.1 算法 8.1 得 到 [aoa,…a,] ， 满 足 
[asa a] * [pipip] = 2^1 .$ 
HO<S<([p,p,---p,]. 
证 明 : WA HTAR., ARR 21, BHI, ABBE. MIME, Bit C = [ec 
Coal, Py = [pp Pia], Pa = [Punpa Palo HBA P = [pp,sp])2P2"7 «P,. HBB 


CP, =2''-S 
R'UBOxS«P, 在 第 3 8, D-[dd,--d,]Hi FREAD 
D = C2? - (P2 +P,) (8-3) 


因为 p, =1, P227", WUR C2", BF D«2"^, MA 2k 位 足以 用 来 表示 Do 
考虑 乘积 PD = (P2 +P,)D, H5X(83)58i: 


PD = CP,2™ + CP,2™ - (CP 2" + CP,)? (8-4) 
通过 把 式 (84) 中 的 CP, BHO 2^! - 5， 并 且 进 行 一 些 代数 化 简 ， 可 得 : 
PD = 2*? - (S2? - CP,)’ (8-5) 
式 (8-5) 除 以 2 ， 可 得 
Qul xs «T (8-6) 


其 中 T=(52” -CP,) 2777" 。 通 过 归纳 假设 和 P, «27, 可 得 $<2”。 B C«2" MP, <2”, 
A O<T<2‘", 
在 第 4 行 ， 4=[aoa…ay] z|D/2^! |, 现在 有 


?| ge porem n) 


所 以 ， 从 式 (8-6) 可 得 


2e > Sa > PL ze > xu P 22! -T-P >2”' -2 -2 
这 样 
D 25994 qq 
PL roe =2 S 
Eposs <24 42, RS P22"", €iB63n$)| D2" 上 ， 可 得 到 满足 归纳 假设 大 的 数 。 
因为 这 部 分 工作 被 第 5 ~7 行 执行 ， 所 以 归纳 步 成 立 。 口 


定理 8.2 存在 一 个 常数 c,， 使 R(n) «cM(n) KT, 

证 明 ; 算法 8.1 可 以 在 O,CMCrO ) 时 间 内 完成 。 第 2 行 要 求 R(k/2) 次 位 操作 。 第 3 行 包含 
平方 和 乘法 操作 ， 分 别 需要 M(k/2 +1) 和 MM(k+2) 时 间 ， 再 加 上 一 个 减法 需要 0,(%) 时 间 。 注 
意 ， 乘 以 2 的 短 的 乘法 操作 不 需要 任何 位 操作 ; 乘 数 的 位 数 可 以 简单 认为 是 占有 新 的 位 置 ， 即 好 


像 已 经 位 移 了 。 由 对 M 的 假设 ，M(k2 + 1) t MCOE 2) 成立。 进一步 而 言 ，MCE+2) - MCh) 


的 时 间 复 杂 度 即 O,C(E) (参见 2.6 节 为 例 ) ， 那 么 存在 常数 ， 使 第 3 行 的 执行 时 间 界 为 MCk) 


+c'k。 第 4 行 的 执行 时 间 显 然 为 0,() 。 

在 第 5 ~7 行 的 循环 中 需要 三 个 乘法 ， 但 是 这 些 计算 可 以 通过 一 个 乘法 [aoa ---a,] * [pipi 
p, ] 和 最 多 2k 位 整数 的 加 法 和 减法 来 完成 。 所 以 第 5 ~7 行 的 执行 时 间 界 为 WE) € e" (X) ，o 是 一 
个 常量 。 把 所 有 代价 相 加 ， 有 下 式 
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R(k) < R(4)s TM) + ck (8-7) 


其 中 cl 是 一 常量 。 
可 以 说 存在 一 个 常量 c， 使 得 R(k) <cM(k) 成立 。 选 择 c, WE cR R(OD/M(ODRGRS + 
2c,。 对 进行 归纳 来 验证 这 一 说 法 。 初 始 上 =1， 结 论 显然 成 立 。 对 式 (8-7 ) 进行 归纳 ， 因 为 


R(k) < e(t). ŠM) tek (8-8) 
因为 对 M 的 假设 可 以 得 到 M(4/2) FMC), JEFLRUR E MCK) ， 可 以 把 式 (8-8) 改 写 为 


RO) < (E+ +o) M(B) (8-9) 


因为 "=>5 +2c,, BAK (8-9) BAS R(k) <cM(k) D 
显然 ， 如果 P 的 位 数 不 考 虑 ， 二 进 制 小 数 点 的 具体 位 置 ， 算 法 8.2 可 以 用 来 计算 L/P 到 n 个 


ded. AM, MUR C <P <1, PA n 位， 很 显然 ， 通 过 改变 比例 ,可 使 1/P 结果 为 1 加 上 小 数 


点 后 面 的 n -1 个 有 效 位 。 
下 面 说 明 对 一 个 大 小 为 n 的 整数 进行 平方 操作 需要 的 时 间 5(n) 不 会 比 求 一 个 大 小 为 n 的 整 
数 的 倒数 需要 的 时 间 R(n) 大 一 个 数量 级 。 该 技术 用 到 恒等式 


1 
P = 1.1. -P (8-10) 
P P+l 

下 面 的 算法 在 恰当 的 比例 下 使 用 式 (8-10) 。 

算法 8.2 通过 倒数 求 平方 。 

输入 ; 以 二 进 制 表示 的 ”位 整数 P。 

输出 : P SERIE. 

方法 : 

1. 追加 2n 个 0 到 忆 再 利用 算法 8.1 计算 4 =12”…/Pj。 然 后 利用 RECIPROCALS 计 算 
[2*"/p2" |, BAL; 

2. 用 类 似 的 方法 计算 B 2| 2^7 (P1) J; 

3. B C=A-B, C22" /(P «P) «T, HPI T! <1。 引 入 TT 在于， 当 计 算 4 和 8B 时 ， 
截取 操作 将 会 引起 大 于 12S. ED 2" «P'eP«2", H2" CRUS. 

4. YT D-12* 7C] ~P; 

5. 设 0 是 P 的 最 后 4 位 ， 尽 可 能 小 地 向 上 或 向 下 调整 D 的 最 后 4 位 ， 使 得 值 能 够 和 0 的 最 
后 4 位 相 一 致 。 口 

定理 8.3 算法 8.2 计算 户 。 

证 明 : ETAR 1 An PRI 我 们 能 够 确定 的 仅 是 


=- p+ 7, 其 中 1 Ti<1 
BUF2UC«C«2"", 并且 C 的 误差 在 -1~ +1 范围 内 ， 所 以 2”-'/C 的 误差 最 多 为 
an 24n-1 _ 2*1 
reu" és 








O 在 算法 8. 1 中 定义 的 RECIPROCAL 是 专门 针对 长 度 为 2 的 天 的 整数 。 对 于 长 度 不 是 2 的 震 的 整数 推广 是 在 必要 
的 时 候 通 过 加 0 和 改变 比例 。 
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AAC - C>2”” ， 所 以 误差 最 多 为 4。 第 A 行 的 截取 操作 会 把 误差 扩大 到 5。 这 样 ，| P^ - DI 
< 和 5。 所 以 在 第 5 步 中 计算 PR 4 位 可 以 确保 DD 调整 到 正好 等 于 P. 口 
例 8.2 Pien=4, P-[1101], BMA 
A 2|25/[1101] | = [100111011000] 


并 且 
B =|2%/[1110] | = [100100100100] 
Tunt* c, 
C = A-B = [10110100] 
然后 ， 


D -25/C] - P = [10110110] - [1101] = [10101001] 

因此 ，13 的 平方 D =169， 在 第 5 步 中 不 需要 进行 修正 。 口 

定理 8.4 存在 一 个 常数 c, 使 S(n) <cR(n), 

证 明 ; 算法 8.2 使 用 三 个 长 度 最 多 为 3n 的 二 进 制 串 的 倒数 ， 第 3 和 4 步 的 减法 需要 0,(n) 
时 间 ， 加 上 第 5 步 中 与 n 无关 的 固定 量 的 计算 开销 。 所 以 

S(n) <3R(3n) + en (8-11) 

其 中 ci 是 常量 。 由 此 ，$S(n) <27R(n) +cin。 因 为 R(n) >n， 选 择 c =27 +c,， 定 理 得 证 。 口 

定理 8.5 M(n)，R(n),，D(n) 和 S(n) 都 是 常量 因子 相关 的 。 

ing). 已 经 证 明了 存在 常量 和， 使 Rn) <c/M(n) RIS Qn) <cR(n) 成 立 。 通 过 4B = 二 
[(4«B)! -A!- B], WUBAA MBB M(n) <c,S(n)。 由 此 ，M、R 和 S 都 是 常量 因子 相 
关 的 。 

当 讨 论 =” 位 数 的 除法 时 ， 是 指 一 个 最 多 2n 位 的 数 除 以 一 个 位 数 ， 得 到 最 多 n+) 位 的 结 
果 。 显 然 有 R(n) &D(n), PRA M(n) 过 ccsD(n) 。 进 一 步 通过 恒等式 4/B =A x (1/B)， 可 以 知 
道 存在 常数 c， 使 得 (注意 比例 ) 


D(n) < M(2n) + R(2n) + cn (8-12) 
因为 很 容易 可 以 得 到 R(2n) «c, M(2n), M(2n) <4M(n), ， 可 改写 式 (8-12 ) 为 
D(n) «4(1 +¢,)M(n) + en (8-13) 
因为 M(n) >n， 从 式 (8-13) 可 以 得 到 D(n) &c,M(n), Hc, =444c, * c, Ait, RAW 
函数 都 是 在 dM(n) 和 eM(n) 之 间 ， 其 中 d Me 是 正 整 数 常量 。 L1 
推论 2n 位 整数 除 以 =” 位 整数 可 以 在 0, (nlognloglogn) 时 间 内 完成 。 
证 明 : 通过 运用 定理 7.8 和 8.5 证 明 。 M 


8.3 多项式 的 乘法 和 除法 


前 一 节 所 介绍 的 技术 都 是 一 元 多 项 式 算术 。 在 本 节 中 ，M(n)，D(n)，R(n) 和 S(n) 分 别 表 
示 n 次 多 项 式 导 、 除 、 求 倒数 和 求 平方 所 需要 的 时 间 。 和 前 面 一 样 ， 假 设 对 于 a1， 不等式 
a^M(n) zM(an) >aM(n) 成 立 ， 其 他 函数 类 似 。 

对 于 次 多 项 式 p(x) ,“ 倒 数 ” 表 示 为 | x" pla) IP, D(n) HBB s(x)/p(x) | 所 耗费 的 时 
间 ， 其 中 PCx) 的 次 数 为 上 ，s(x) 的 次 数 不 超 过 2n。 注 意 ， 可 以 通过 乘 以 和 除 以 x 的 害 来 “伸缩 ” 
(scale) 多 项 式 ， 和 上 一 节 通 过 2 的 短促 缩 整 数 一 样 。 


O ”和 整数 中 的 概念 类 似 ,可 用 “下 取 整 应 数 ”( floor function) 表示 多 项 式 的 商 。 也 就 是 说 ， 如 果 p(s) 不 是 一 个 常 
E, 那么 Ls(x)/p(x) ] 是 唯一 的 g(x)， WHE s(x) =p(x)g(x) +r(x) 和 DEG(r(x)) <DEG(p(x))。 
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由 于 本 节 中 的 许多 结果 和 上 节 中 有 关 整 数 的 结果 类 似 ， 仅 给 出 一 个 详细 的 结果 : SHR“ A 
数 "算法 ， 该 算法 类 似 于 算法 8. 1 中 整数 的 倒数 算法 。 由 于 在 多 项 式 算 法 中 不 会 像 整数 算法 中 那 
样 产生 把 次 数 序列 从 一 个 地 方 移动 到 另外 一 个 地 方 的 情况 ， 所 以 多 项 式 算法 在 某 种 程度 上 比 整 
数 算法 更 简单 。 这 样 ， 多 项 式 算 法 不 需要 和 算法 8. 1 中 的 第 5 ~7 行 一 样 调整 最 低 有 效 位 的 位 置 。 

算法 8. 3 多项式 倒数 。 

输入 : n -1 次 多 项 式 p(x)， 其 中 n 是 2 WEL BW p(x) FEAR, Hep AR). 

输出 :“ 倒 数 ”| x” /p(x) |. 

方法 : 图 8-2 中 定义 一 个 新 的 过 程 


RECIPROCAL ( > ax ) 
Hpk 是 2 HH a,., 关 0。 该 过 程 计算 


HEM, MRk=1, 那么 参数 是 一 个 常量 co ， 其 倒数 1/ao 是 另外 一 个 常量 。 假 设 对 系数 的 每 个 操 
作 都 可 以 在 一 步 内 完成 ， 且 计算 1/ao 不 需要 调用 RECIPROCAL, 
算法 本 身 以 p(x) 为 参数 调用 RECIPROCAL, 口 





k- 
procedure RECIPROCAL (S ag’); 


i-0 





if k = 1 then return l/a; 
else 


ui RECIPROCAL ( S. apin); 
qi) € A (X a,x! ); 






i 


r(x) © 2q(x)x9 -t — (q(x))* ( y as 
i=0 


return {r(x)/x*~?} 
end 





图 8-2 计算 多 项 式 倒数 的 算法 


例 8.3 计算 Lx jp(x) 1， 其 中 p(x) 2x -1 +i «2x! -X -3x +x+4。 算 法 第 2 行 计算 x 
-x +x+2 的 倒数 ， 也 就 是 g(x) = [x (è -x+x+2)]。 可 以 验证 q(x) 23 4x -3。 因 为 上 = 
8， 算 法 第 3 AUB r(x) -294 (0x? - (q(x) Y pla) =x? «x? -3x0 -48 & 333 +15x’ + 120° - 422° 
-34x «39x? «51x? -9x -36。 在 第 4 行 ， 结果 是 s(x) =x +a -3x -4x +3x +15x+12。 记 
s(x)p(x) 为 x“* 加 上 一 个 6 次 多 项 式 。 口 

定理 8.6 算法 8.3 正确 地 计算 多 项 式 的 倒数 。 

证 明 : 对 上 进行 归纳 ， 其 中 是 2 的 短 。 如 果 s(x) = RECIPROCAL(p(x)) , p(x) 为 k~1 次 ， 
那么 s(x)p(x) 22^ “+t(x)， 其 中 i(x) 是 次 数 小 于 上 -1 的 多 项 式 。 归 纳 基础 k=1 时 ， 因 为 
p(x) 2a,, s(x) =1/ao，i(%) 不 需要 ， 所 以 结论 显然 。 

在 归纳 步 ， 假设 p(x) =p,(x)x'? +p, (x), HH DEG(p,) 2 &/2-1, DEG(p,) &k/2 -1, 3B 
么 由 归纳 假设 ， 如 果 s,(x) = RECIPROCAL(p, (32), BBA, s (xp, (x) 2x ^ +t (x), 其中， 
DEG(1,) <k/2 -1。 在 第 3 行 中 计算 

r(x) = 2s(x)x ?~ (s(x)) (p(x)x + p,(x)) (8-14) 
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这 足以 说 明 r(x)p(%x) 是 x**“ 加 上 次 数 小 于 2k -3 的 项 。 那 么 在 第 4 行 中 除 以 x*“ 可 以 得 到 期 望 的 
结果 。 


由 式 (8-14) 和 p(x) =pi(x)x” +p,(x)， 可 以 得 到 
r(x)p(x) = 2s, (x) p (x) x? + 2s, (x) p, (x) 0 7*? - Cs (x) p, (x) x? + s (x)p,(x))? 


(8-15) 
在 式 (8-15) PH s (x) p, C) BRAH xt? +t (x), TAR 

r(x)p(x) = x** - (t, (x)? + s () p (X) )? (8-16) 

因为 DEG(5) <k/2 -1，s,(x) 和 p,(%) 的 次 数 最 大 为 k/2 - 1, BELASR(8-16) PRT x “op, H 

余 项 的 次 数 最 大 为 2k -4。 口 


当 考 虑 不 同 的 时 间 复 杂 度 衡量 标准 (分 别 为 位 操作 和 算术 操作 ) 时 ， 很 明显 算法 8.1 和 8.3 
的 运行 时 间 是 相似 的 。 通 过 类 似 的 方式 ， 把 算术 操作 步骤 替换 为 位 操作 ， 可 以 得 到 8. 2 节 中 的 时 
间 边 界 也 适用 于 多 项 式 情 况 。 由 此 ， 有 下 面 的 定理 。 

定理 8.7 4&3 M(n), D(n), R(n)fn 3S(n) 分 别 表示 一 元 多 项 式 秉 法 、 除 法 、 求 倒数 和 平 
方 的 算术 复杂 度 ， 那 么 这 些 函 数 是 常数 相关 的 。 


证 明 ， 过 程 类 似 于 定理 8.5， 得 到 的 结论 也 与 之 相同 。 m 

推论 : 2n 次 多 项 式 除 以 A 次 多 项 式 可 以 在 0,(nlogn) 时 间 内 完成 。 

证 明 : 由 定理 7.4 的 推论 3 和 定理 8.7 可 以 得 到 。 口 
8.4 BRA 


许多 应 用 中 用 “ 模 ” 的 记 法 (“ modular”notation) 做 整数 的 算术 操作 是 非常 便捷 的 。 也 就 是 说 ， 
不 用 固定 基数 记 法 表示 整数 ， 而 是 用 它 模 一 系列 两 两 互 质 的 整数 得 到 的 余数 来 表示 。 如 果 p, 
Pi ocn, p -是 两 两 互 质 的 整数 ， 并 且 p = 了 -ip;， 那么 可 以 把 任意 uw(0<u<p) 表 示 为 余数 集合 
uy, Uy, cn, wi, Ku su p(Osi<k), BA p, Po to pa PURI, u(y, 
Uy, c, Uu, 1)o 


对 于 结果 在 0 ~p -1 之 间 的 加 、 减 、 乘 演算 相当 容易 (另外 ， 也 可 以 认为 这 些 演算 是 在 模 p 
下 进行 的 ) 。 也 就 是 说 


uc*(u, uu, 4) Al ver (04,0, ont) 
那么 
u +v wy, w, w), RAP w, = (u; + v) mod p, (8-17) 
u — V(X 4%, 其 中 x = (u; — v) mod p, (8-18) 
uy (y, y, Ya) ;其 中 y= u,v,mod p, (8-19) 


818.4 假设 mm =5, p 23, p, =2。 因 为 4=4 模 5, 1-434383, O-A 2, MUA 4e(4, 
1, 0), 2p, 7 (2, 1, 1) 80289 (3, 1, 0), Ht E IIS C 8-19) WBA 4 x 79 (3, 1, 
0)， 是 28 的 对 应 表示 。 也 就 是 说 4 x7 的 第 一 个 分 量 是 4 x2 BES 得 到 3; 第 二 个 分 量 是 1 xl 模 3 
得 到 1; 最 后 一 个 分 量 是 0 x1 模 2 得 到 0。 类 似 地 ,4+7e*(1, 2, 1), 是 11 的 对 应 表示 ; 7 -4 
(3, 0, 1) 是 3 的 对 应 表示 。 口 

然而 ， 我 们 还 没有 说 明 如 何 利用 模 算术 快捷 地 计算 除法 操作 。 需 要 注意 wo 不 一 定 是 整数 ， 
即使 是 ， 也 不 能 够 通过 对 每 个 i 计算 (w/w,) 模 p; 找 到 其 模 的 表示 。 实 际 上 ， 如 果 p TEAK, I 
么 存在 多 个 0 M p -1 之 间 的 w， 其 中 等 于 (w/w) 模 p;， 因 为 ww,=w, 模 p,。 例 如 ， 如 果 p, =6， 
v,23, w=3，, 因为 1 x3=3x3=5x3=3 模 6， 所 以 w 可 以 是 1、3 或 者 5。 在 这 种 情况 下 ， 
(wu,/2) 模 p, 就 变 得 “不 合理 ”。 
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模 表 示 方 式 主要 的 优点 在 于 其 算术 操作 所 需要 的 硬件 支持 比 卷 积 操作 需要 的 硬件 支持 更 少 。 
其 原因 在 于 每 个 模 操作 的 演算 是 不 相关 的 。 通 常 的 数值 表示 ( 即 基于 基 位 的 表示 法 ) 是 不 需要 进 
位 的 。 遗 憾 的 是 ， 它 在 除法 操作 和 有 效 地 发 现 溢出 (也 就 是 分 辨 出 结果 是 否 超出 0 ~ p -1 这 个 范 
围 ) 的 问题 难以 克服 ， 辣 时 这 类 系统 通常 很 少 以 计算 机 硬件 实现 。 

尽管 如 此 ， 这 个 思想 还 是 有 用 的 ， 主 要 是 在 多 项 式 领域 。 在 这 里 ， 我 们 希望 找到 一 个 不 需 
要 多 项 式 除法 的 情况 。 下 一 节 将 会 看 到 多 项 式 计 值 和 多 项 式 余数 ( 模 其 他 多 项 式 ) 的 计算 是 紧密 
相关 的 。 首 先 证 明 整 数 取 模 的 算术 操作 会 按 预 期 进行 。 

证 明 的 第 一 部 分 说 明 公式 (8-17)、(8-18) 和 (8-19) 成 立 。 这 些 关 系 是 显而易见 的 ， 所 以 留 
给 读者 作为 练习 。 证 明 的 第 二 部 分 说 明 wo(wo，w, ，…，w-1) 这 种 对 应 关系 是 一 对 一 的 ( 同 构 )。 
虽然 这 个 结论 并 不 难 证 明 ， 我 们 还 是 给 出 一 个 引 理 。 

引 理 8. 1 假设 p。，p,，…，ps_! 是 一 个 整数 集合 ， 其 中 任何 两 个 数 都 是 互 质 的 。 设 


p= II» 
FH u, zu HE pio RAMFO<u<p, u(y, u, c, u, ,) HEX u É—S — RR, HA 
(uu, ,7,u,4),0 Su, < p 


其 中 0<i<k。 ` 

证 明 : 很 显然 ， 每 个 z 存在 一 个 对 应 的 大 元 组 。 因 为 区 间 中 正好 有 zw B p 种 值 ， 也 正好 有 p 
个 上 元 组 ， 这 足以 证 明 每 个 元 组 至 多 有 一 个 整数 4 与 之 对 应 。 假 设 w、v 满 是 0<u<v<p， 这 
两 个 数 都 和 元 组 uy, u cc. u, 1 对 应 。 那 么 vy- wu 必定 是 每 个 p; 的 倍数 。 因 为 p, 是 互 质 的 ， 
v-u VEE p 的 倍数 。 因 为 wzv 并 且 v -wu 是 p 的 倍数 ,那么 和 vw 之 间 的 差距 至 少 是 p， 所 以 ， 
它们 不 可 能 都 在 0 ~p -1 范围 内 。 口 

为 了 使 用 关于 模 运 算 ， 需 要 有 算法 能 够 实现 基数 表示 法 和 模 表示 法 之 间 的 转换 。 把 整数 
从 基数 表示 法 转换 到 模 表 示 法 的 一 个 方法 是 用 每 个 p, 除 w， 其 中 0<i<k。 
| 假设 在 二 进 制 表 示 法 中 ， 每 个 p, 需 要 5b 位， 那么 


p= JI» 

大 致 需 要 bk 位 ， 用 w 除 以 每 个 p,， 其 中 0<u<p， 和 需要 调用 上 次 即位 整数 除 以 5 位 整数 
的 除法 。 把 每 个 除法 分 为 上 个 26 位 整数 除 以 5 位 整数 的 方式 ， 可 以 在 OLCIE DCb) ) BE Tg] 
内 实现 向 模 表 示 方 式 的 转换 ， 其 中 D(n) 是 整数 除法 需要 的 时 间 [ 由 定理 8.5 的 推论 知 至 
多 为 0,(n log n log log n) ]. 

然而 ， 回 想 7. 2 节 中 用 到 的 多 项 式 除 法 技术 ， 利 用 该 方法 我 们 可 以 在 更 少 的 时 间 内 完成 该 工 
作 。 TRIER uS p, Pis Us Pi-! 的 k 个 除法 不 同 ， 首先 计算 pp, Dips cs ProPp WRB, 
然后 计算 Popip:p: PaPsPcP1, "RA, SS. F-PANETRRR. Au Bp pM 
u BE pa p REAM ARK uv, Lus 1H u IR pL (Os iK) KERERE AARRE 
的 问题 了 。 也 就 是 说 ， 当 0<i<k/2 时 ， up, zu tp, M k/2<i<k Bf, u BE p; = u, 8 p;o 

算法 8. 4 余数 的 计算 。 

RA: BLP, po oo Py AU, Hp O<u <p =I ip, 

输出 : u(0sick), Hin u, =u po 

方法 : 假设 k 是 2 的 矫 ， 也 就 是 k=2’'。( 如果 和 需要， 可 以 加 入 一 些 1 到 输入 作为 模 ， 使 得 上 
成 为 2 的 者 。) 从 计算 模 的 乘积 开始 ， 方 法 类 似 于 7. 2 节 中 qu 的 计算 。 

对 于 0<j < 二 i 是 2 的 倍数 ， 且 0<i<k, it 


i«2'-1 


q; = II». 
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BBA qio =Pi， qj = qi 5-1 X Vise, j-10 
首先 计算 gq;， 当 4 除 以 每 个 g, 时 ,可 以 得 到 余数 内。 期 望 的 结果 是 we。 详细 的 程序 见 图 
8-3, 口 


begin 
for i —— 0 until k — 1 do q4 — pi; 
for j «- i until f — 1 do 
for i «— 0 step 2/ until k — 1 do 
Qu © du-i * dieaiu-i; 
Mo, *— u; 
for j — ! step —1 until 1 do 
for i — 0 step 2! until k — 1 do 


Hij- *7 REMAINDER(ugdq,;:); 
Uissri4-1 — REMAINDER (u Yairi- 5-1) 


$ 
for i — 0 until k — 1 do u; — us 


end 





图 8-3 余数 计算 


定理 8.8 算法 8.4 正 确 计 算 w。 

证 明 : 这 个 定理 的 证 明和 定理 7.3 的 证 明 是 平行 的 ， 在 定理 7.3 中 多 项 式 在 n 次 单位 根 下 计 
值 。 通 过 对 j 归纳 很 容易 知道 第 4 行 对 gq, 的 计算 是 正确 的 。 然 后 ,通过 对 第 6 行 j 的 逆向 归纳 可 
以 证 明 u, =w 模 g,。 第 8 和 9 行使 这 个 过 程 变 得 很 容易 。 假 设 j=0， 那 么 有 w=4 模 p,。 证 明 的 
详细 过 程 留 作 练 习 。 口 

定理 8.9 如 果 每 个 p, 最 多 需要 5b 位 来 表示 ,那么 算法 8.4 € O,CMCk)logk) iti. 

证 明 : 很 容易 可 以 看 到 第 3 ~4 行 以 及 第 7 ~9 行 的 循环 需要 花费 的 时 间 最 多 ， 每 个 需要 
O,(2'7M(2'"'b) BTS. (RPE M(an) =aM(n), 其 中 a>1, 这 些 循环 花费 的 代价 在 
O,(M(2/5)) = 0,(M(kb) ) 范 围 内 。 因 为 每 个 循环 最 多 循环 ;=logk 次 ， 由 此 可 以 得 到 结果 。 口 

推论 : 如 果 每 个 模 po, P ，…，p,_! 需 要 5b 位 表示 ， 那 么 余数 的 计算 最 多 可 以 在 O,( dk log k 
log bk log log bk) 时 间 内 完成 。 


8.5 多 项 式 模 算术 和 多 项 式 计 值 


多 项 式 情况 下 的 结果 类 似 于 整数 。 假 设 m ，…，p,_1 是 多 项 式 , p = IL 0p;， 那 么 每 个 多 项 式 
u 可 以 用 一 系列 余数 wu，w; ，…，wi_! 表 示 ， 其 中 以 是 w 除 以 p, 得 到 的 余数 。 也 就 是 说 ，w, 是 满足 
DEG(u,) < DEG(p,) fll u = p,q, + wi 的 唯一 多 项 式 。 这 里 ， 完 全 模拟 整数 模 算术 ， 把 求 余 数 记 为 
u, =u KE p;o 

类 似 于 引 理 8. 1， 我 们 将 证 明 ， 如 果 p AREA, u 的 次 数 小 于 p 的 次 数 ， 例 如 SIZE(w) < 
SIZE(p)， 那 么 wuo，uwi，…，uwi.1) 是 一 一 对 应 的 。 更 重要 的 是 ， 计 算 余 数 的 算法 8. 4 在 p, 是 
多 项 式 而 不 是 整数 的 时 候 仍然 适用 。 我 们 不 考虑 b(p, 的 位 数 ) ， 而 考虑 多 项 式 p, 的 最 高 次 数 。 当 
然 ， 复 杂 度 也 是 根据 算术 操作 步 数 ， 而 不 是 位 操作 数 衡量 。 通 过 这 些 改变 ， 可 以 得 到 类 比 于 定理 
8.9 的 结果 。 

定理 8. 10 把 算法 8.4 KEIRA, ITE UA XT ERAN. s pae 
数 可 以 在 0,(MM(dk)log 上 ) 时 间 内 完成 ， 其 中 d E p XO EE, OE uHKRD FO p.e 


O 回忆 一 下 : D(n) 和 MM(n) 在 实质 上 是 相同 的 。 
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证 明 ; 与 定理 8.9 类 似 ， 留 作 练习 。 口 
推论 1 计算 多 项 式 & 关 于 多 项 式 po P ，…，p，_! 的 余数 ,需要 的 时 间 最 多 为 0 (dklog klog dk), 
其 中 4d 是 p, 次 数 的 上 界 ， 并且 u 的 次 数 少 于 Ip. 
例 8.5 考虑 下 面 4 个 多 项 式 的 模 
Py =x-3 
py =e tut) 
P2 =x -4 
P, =2x +2 
B u= tr 4 tr +x+1。 首 先 计算 乘积 
PoP, = x -2x - 2x -3, 
pp. = 2x +2x -8x -8 
然后 计算 
u' = umod p,p, = 28x + 28x + 28 
u” = umod p,p, = 21x + 21 
ERE u = pap, (x^ 83x 49) +28x «28x 428 flu -pp (3 +5) +21x +21, 
下 一 步 计 算 
u mod p, = u' mod p, = 364 
u mod p, = u'mod p, = 0 
u mod p, = u"mod p, = 21x + 21 
u mod p, = u"mod p, = 0 L1 
TEM, 7.2 节 中 的 FFT 算法 实际 上 是 这 个 算法 的 具体 实现 ， 其 中 多 项 式 m, Po s pad 
x-o,x-o +, x-Q' 。FFT 算 法 利用 pP = zx- 由 这 一 事实 。 因 为 书 的 顺序 ， 每 个 乘积 都 有 x 
BE o 的 器 这 种 形式 ， 所 以 除法 操作 非常 容易 。 
和 我们 在 7.2 节 中 看 到 的 一 样 ， 如 果 p; 是 一 次 多 项 式 * -a， PAuR pW ula), Bik, 
有 p; 的 次 数 都 是 1 的 情况 非常 重要 。 对 定理 8. 10 有 如 下 推论 。 
推论 2 n 次 多 项 式 可 以 在 0,(nlogn) 时 间 内 在 个 点 进行 计 值 。 
EA: 为 了 在 ao，a1，…，Q,_1 这 个 点 对 u(x) 计 值 ， 当 0<i<n 时 , 计算 w(x) 模 (x -a,)。 
因为 4 为 1， 由 推论 1 得 知 这 个 计 值 过 程 需 要 O, (nlog n) EB], 


8.6 FRR 


现在 讨论 如 何 把 整数 从 模 表示 转化 为 基数 表示 9 。 假 设 有 互 质 模 ps pss pua ARK m, 
uy, c, uu, RP k=2', BERI Ted u, fiue(u, ucc. uae AFEK, RARI 
作 将 类 似 于 多 项 式 的 拉 格 朗 日 插值 公式 。 

引 理 8.2 假设 c 是 所 有 pp,( 除 了 p,) 的 乘积 ( 即 c, =p/p,, rh p 2 ID p) 
HdE ' 模 p,( 也 就 是 说 dic,=1 模 p;， HO<d,<p,), BA 


k-1 


“= >, c,d,u,mod p (8-20) 
证 明 ， HX p, Ru ma, 所 以 d, 存 在 并 且 唯 一 (习题 7.9)。 又 因为 对 于 ji， c 可 以 被 p Æ 





但 ”这 就 是 着 名 的 中 国 余数 问题 ， 因 为 这 个 过 程 中 国 在 2000 年 前 就 发 现 了 。 


am 


ao a 





Da ma a aa m rm a o m e a A a 


ERS $331 X 181 


除 。 所 以 ， 如 果 产 六 则 cdu, m0 p. ALA 


Y c,d;u; = c,dju,mod p, 


AAed=1 BE p, BU 


Y. cidiu = wmod P; 


又 因为 户 除 p， 所 以 ， 即 使 所 有 的 算术 都 模 p， 关 系 仍然 成 立 。 这 样式 (8-20) 成 立 。 口 

问题 是 如 何 有 效 地 计算 式 (8-20) 。 开 始 时 ， 使 用 试 错 法 如 何 从 疡 计算 d 是 很 难 搞 清 楚 的 。 但 
稍 后 将 会 看 到 这 个 计算 任务 并 不 难 ，8. 8 节 将 给 出 解决 该 问题 的 欧 几 里 得 算法 和 8. 10 节 将 给 出 
算法 的 快速 实现 。 然 而 在 本 节 ， 我 们 仅 研 究 中 国 余数 问题 的 “预备 好 ”的 形式 ( preconditioned 
form) 。 如 果 对 于 一 定数 量 的 问题 ， 它 的 一 部 分 输入 是 固定 的 ， 那么 所 有 依赖 于 固定 输入 部 分 的 
常量 可 以 预先 计算 ， 并 且 作 为 输入 的 一 部 分 。 如 果 所 有 这 些 常量 的 预计 算 完 成 ， 那 么 该 算法 称 为 
预备 好 的 。 

对 于 预备 好 的 中 国 余数 算法 ， 输 入 不 但 是 模 和 p,， 还 包括 逆 d,。 这 种 想法 并 非 不 现实 的 。 如 
果 经 常 使 用 中 国 余数 算法 转化 由 固定 模 集 表示 的 数 ， 那 么 预先 计算 所 有 在 算法 中 用 到 的 模 的 函 
数 是 很 合理 的 。 在 定理 8. 21 的 推论 中 将 看 到 ， 只 要 涉及 到 数量 级 ， 对 于 算法 是 否 预 备 好 只 产生 
稍微 的 不 同 。 

看 式 (8-20) ， 可 以 注意 到 项 cdu, ME i 的 改变 有 许多 公共 的 因子 。 例 如 ， 当 ik/2 时 ,cdiu 
A Pop Pn ERAT; 当 i<k/2 时 ， 有 Piapip Pi 作为 因子 。 所 以 ， 可 以 把 式 (8-20) 写 成 


u = (F e'di) x TI P: + » edu, ) x The. 
其 中 c,' 是 Poy Piss Pam .1 的 乘积 (其 中 不 包括 p), c" RE Pins Paa, cs Py OHO HAR 
包括 p,)。 这 实际 上 建议 使 用 类 似 于 余数 计算 中 的 分 治 法 。 计 算 下 面 的 乘积 


q; = II». 
(ffl 8. 4 中 类 似 ) 然 后 计算 整数 


sy = XT EVA 

如 果 j=0， 那 么 se = diu。 如 果 j >0， 则 通过 下 面 的 公式 计算 s; 
最 后 ,计算 出 sw =w， 也 就 是 式 (8-20) 。 

算法 8.5 快速 中 国 余数 预备 好 算法 。 

RA; 

1. 互 质 整数 模 po, Pis Us Pi-is 其 中 存在 1， fi k-2', 

2. "38" WES d,, d,, Ut, d, ,, 满足 d, = (p/p,) E p,, JEP p =I hp, 

3. BBE (uy, Uy. t, U, 1)o 

输出 : 唯一 的 整数 u, Ou <p, 满足 ueQOs, Ui, Y, U, i) o 


方法 ; 首先 如 算法 8.49, THE g = TI ps。 然 后 执行 图 8-4 中 的 程序 ， 其 中 * 是 


i42-1 
Y 9q,4,,U,,/P 口 
mzl 


it Tine P Siz Gig 


O ER, eq, UE p; 的 函数 。 因 为 允许 预先 准备 ， 所 以 把 它们 包含 在 输入 里 ， 而 不 是 计算 得 到 。 然 而 ， 很 容易 证 明 
运行 时 间 的 数量 级 不 受 g; 是 否 预 计算 影响 。 


for i + 0 until k — 1 do s, di* uu; 


for j — 1 until t do 
for i — 0 step 2! until k — 1 do 
Sy © Siji * Quai t Sites * Que 
write sx modulo qs 
end 





图 84 ”由 模 表示 计算 整数 的 程序 
例 8.6 假设 po, Py, Pr» P282, 3, 5, 7, (Cu, t, w, u) ACH, 2, 4, 3)。 对 于 0<i 
<4 qo 7 p,, do 76, gn 735, gm 7 p 2210, ic 
因为 1*105 = 1mod 2,BrbL d, = (3*5*7) mod2 = 1 
因为 1*70 2 1 mod3, 所 以 di = (2*5*7) mod3 = 1 
因为 3*42 = 1 mod 5, 所 以 d, = (2*3*7) ! mod 5 23 
因为 4*30 = 1 mod 7, FEL d, = (2*3*5) ! mod 7 = 4 
如 此 ， 第 一 行 的 效果 就 是 计算 


t 


So = 1l*i =1,8, =1*2 =2 
Sy = 3 #4 = 12,54, = 4*3 = 12 
然后 执行 第 3 ~4 行 的 循环 ,， 且 j=1。 其 中 i 在 0 和 2 取 值 ， 所 以 计算 
Sor = So * dio + Sio * Joo =1*3 +2 *2=7, 
Say = Say *Q t5 * d. = 12 *7 +12 #5 = 144, 
下 一 步 在 7 = 2 时 执行 第 3 ~4 41890895, i 的 取 值 仅 为 0。 计 算 
so = So * qa + $2, * qo 77 *35 4144 «6 21109, 
第 5 行 的 结果 是 1109 模 210， 为 359。 可 以 验证 ，59 512, 3, 5, 7 得 到 的 余数 分 别 为 1，2，4， 
3。 图 8-5 用 图 说 明 整 个 计算 过 程 。 口 





图 8-5 例 8.6 的 计算 过 程 


定理 8. 11 算法 8.5 EMMI Ru, ARE u(y, usn, ua)e 
证 明 ; 对 /进行 基本 归纳 ， 证 明 RAT MP, hee 
iX- 
s = aid up. 

由 引 理 8. 2 马上 可 以 得 到 算法 的 正确 性 ， 也 就 说 从 公式 (8-20) 的 正确 性 马上 可 以 得 证 。 口 

定理 8. 12 假设 给 定 天 个 互 质 的 整数 模 po， Pis 705 Pi- 和 余数 序列 (uo， B, Ut, us a)o 
如 果 每 个 p, 要 求 至 多 b 位 ， 那 么 存在 一 个 预备 好 算法 能 够 在 OLCM (bk) logk) 时间 内 计算 wu， 使 
OzxucpzII np Puc(uy, uw, s, u 4), Xt Min) dtm E^ n SEMOBATES WR BL. 
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证 明 ; 9; 的 计算 需要 O, (M (bk) logk) BS, WEEER, AW s E 2 THA, 
且 每 项 都 是 2 +1 个 小 于 等 于 “位 的 整数 之 和 ， 所 以 % 需 要 至 多 D +b +j 位 。 每 项 要 求 不 多 于 4 
(2 +1) 位 ,2 个 这 样 的 项 要 求 最 多 5b(2 +1) +log(2) = 好 «b «j 位 。 那 么 第 4 行 需要 的 时 间 为 
0s,(M(b2))。 第 3 ~4 行 的 循环 对 于 一 个 固定 的 j 需 要 执行 ww2 次 ， 所 以 整个 循环 需要 的 时 间 为 


0,( LM 62!) ) 


由 关于 M(n) 的 增长 通常 假设 ， 整 个 循环 需要 的 时 间 上 界 为 0;(M(bk) )。 因 为 第 2 ~4 行 的 循环 
重复 了 logk 次 ， 所 以 总 的 代价 为 0,;《( MM(bk)logk) 时 间 。 第 5 行 所 需要 的 时 间 花 费 很 显然 少 于 这 
个 值 。 口 

推论 : 在 上 个 位 整数 模 的 中 国 余数 预备 好 算法 至 多 需要 08( 姑 log k log bkloglog 站 ) 步 计算 。 


8.7 中国 余 数 和 多 项 式 的 插值 


很 明显 ， 前 一 节 中 有 关 多 项 式 模 p。 ，p, ，…，P_， 的 结果 对 于 整数 情况 仍然 成 立 。 所 以 ,我 
们 可 以 得 到 下 面 的 定理 和 推论 。 

定理 8. 13 假设 po(x)，pi(x)，…， ps1(x) 是 次 数 最 多 为 d 的 多 项 式 , 而 MM(n) 是 计算 两 
个 nn 次 多 项 式 需要 的 算术 操作 步 数 。 对 于 给 定 多 项 式 ule), ul), =, ual), APAFA 
有 的 0<i<k，u(x) 的 次 数 少 于 p(x) 的 次 数 ， 存 在 一 个 计算 唯一 多 项 式 u(%) 的 预先 准备 算法 ， 
HEDGE O, (M(dk)log k) 时间 内 完成 计算 ， AF, u(x) 的 次 数 小 于 p(x) = Top; GO) BE, 
Eu(x)ex(u (x), u (x), c, m (x) ) AGE, 

证 明 : 与 算法 8.5 和 定理 8. 12 类 似 。 D 

推论 : 对 于 多 项 式 中 国 余数 问题 ， 存 在 一 个 0, (dk log k log dk) 时间 的 预先 准备 算法 。 

当 所 有 模 的 次 数 都 是 1 时， 可 以 得 到 一 个 非常 重要 的 特殊 例子 。 如 果 p, =x -a,， 其 中 0<i 
<k, RA u 的 余数 是 常数 ， 也 就 是 次 数 为 0 的 多 项 式 。 如 果 u(x) =u, Bi(x-a), SEA u(x) = 
q(x)(x-a,) +u,, PRE u(a,) =u; BRARBUNF k EXE u(x) (us, u, ocn, unu BRE 
多 项 式 w(x) 是 唯一 的 次 数 小 于 天 且 对 于 所 有 0<i ck RE u(a;) =w 的 多 项 式 。 另 外 一 个 解释 是 ， 
ula) 是 通过 在 (a,，u) 点 插值 得 到 的 多 项 式 ， 其 中 0<i<k。 

因为 插值 是 一 种 非常 重要 的 多 项 式 操作 ， 即 使 不 允许 预先 准备 ， 对 点 的 插值 操作 也 可 以 在 
0、(klog*k) 时 间 内 完成 是 很 值得 高 兴 的 事 。 就 像 下 一 个 引 理 中 闪 述 ， 这 是 由 于 在 这 种 特殊 情况 下 
可 以 很 快 地 计算 出 公式 (8-20) 中 的 系数 d? 。 

引 理 8.3 假设 p(x) =x -a,, 0<i<k， 其 中 a 是 明显 的 (也 就 是 说 p,(x) 是 两 两 互 质 的) 。 
WB p(x) 2 ip, clx) =p(x)/p,(x)，d,(x) 是 常量 多 项 式 , 满足 d(x)c,(x)=1 模 p(x)。 


WA d(x) =1/b, X bo pz) 1,.。。 
证 明 : AY LAS p(x) -e(x)p(x), 所 以 


Epa) = pila) Fela) + ela) Dro. GO (821) 
现在 dp,(x)/dx 21 Al p,(a,) =0， 所 以 
set) | | = (a) (8-22) 





O 因为 D(n) 和 MM(n) 本 质 上 是 相同 的 函数 ， 选 择 使 用 M(n)。 
© 和 8.6 节 提 到 的 一 样 ， 在 通常 情况 下 ， 这 个 任务 事实 上 并 不 难 。 然 而 一 般 情况 下 ， 需 要 下 一 节 中 的 机 制 。 
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TER, d(x) WE di(x)e; (x) 81 模 (x -ai) 的 性 质 ， 所 以 ， 存 在 g;(z) 使 di(x)ci(x) 2q,G0 ( - 
a) +1 成 立 。 现 在 d,(a,) =1/c(a,)。 由 于 d,(x) 是 个 常量 ， 所 以 由 式 (8-22) 马 上 得 证 此 引 理 。 O 

定理 8. 14 在 没有 预先 准备 的 情况 下 ， 可 以 在 0,(k log ^k) 时间 内 通过 大 点 插值 一 个 多 
项 式 。 

证 明 : 由 引 理 8.3，4d. 的 计算 等 同 于 对 (k - 1) 次 多 项 式 在 大 个 点 上 求 导 数 。 先 计算 poP P 
p, ，… 的 乘积 ， 然后 计算 PoP PaP» Pspspap ，… 等 等 的 乘积 ， 可 以 在 O, (klog*k) 时 间 内 得 到 多 项 
xk p(x) =ILzop:(%)。 而 p(x) 的 导数 可 以 在 0,(k) 步 内 计算 出 。 由 定理 8. 10 的 推论 2 可 知 ， 导 
数 的 计算 要 求 0, (hlog*%) 时 间 。 当 d =1 时 ， 从 推论 到 定理 8. 13 可 以 得 到 定理 。 口 

例 8.7 在 (1,2)、(2, 7)、(3, 4) 和 (4, 8) 这 些 点 对 一 个 多 项 式 进行 插值 操作 。 当 
Osi<4 时 ,a,=i+tl, uw 22, u 27, u =4 和 w=8。 所 以 p(x) =x-i-1, p(x) =I op: (x) % 
T x* - 10x? 4354? -50x +24, F—2b, dp(x)/dx 24x! - 30x’ +70x -50, Æ 1, 2,3, 4 上 的 值 分 


BI -6. +2, -2. «6, Blk, dy di, dA dA -1 eT. PROC T. ARR 
速 中 国 余数 算法 (算法 8.5) 对 多 项 式 重新 计算 ， 可 以 得 到 


Sq, = dyugp, + diupo = (-Z)@e -2) + (Fe -1) = 2. -E 
$4 = dju,p, + dup, = (- 396 -4) + (2) -3) =- is +4 


那么 


Sy = U(x) = sagn + Sago = (2. - Zo! -7x 412) + (- à «4o -3x +2) 
o 
5 ， 1,89 
u(x) = 了 YX - 19x + 3% ~ 26 


与 第 7 章 所 提 到 的 一 样 ， 我 们 可 以 通过 对 多 项 式 的 = 点 计 值 ， 计 算出 这 些 点 上 的 算术 值 ， 再 
利用 这 些 值 对 多 项 式 进 行 插值 操作 来 进行 多 项 式 算 术 计算 ， 例 如 加 、 减 、 乘 。 如 果 得 到 的 结果 是 
n -1 次 或 更 低 次 多 项 式 ， 那 么 这 个 技术 得 到 的 结果 是 正确 的 。 

FFT 就 是 按照 这 种 做 法 ， 其 中 所 选择 的 点 是 w ，w ，…，w”'。 在 这 种 情况 下 ， 由 于 w OR 
性 和 为 这 些 寡 选 定 的 顺序 ， 使 得 计 值 和 插值 算法 非常 简单 。 然 而 ， 值 得 注意 的 是 ， 可 以 用 任意 点 集 
来 替代 o 的 害 。 需 要 一 次 “变换 ”， 这 需要 O,(nlog mn) 时间 ， 而 不 是 0,(nlogn) 时 间 ， 计 算 和 反 向 。 


8.8 最 大 公 因 子 和 欧 几 里 得 算法 


定义 假设 co 和 wm 是 正 整 数 ， 如 果 满 足下 面 两 个 条 件 ， 则 正 整 数 g 称 为 ao 和 a 的 最 大 公 因 
T. iA GCD(a,, a), 

l.g 可 以 整除 ao 和 ai， 

2. 所 有 ao 和 a 的 因子 都 可 以 整除 g。 

很 容易 得 到 ， 如 果 ao 和 EN, BAe 是 唯一 的 。 例 如 ，GCD(57，33) 等 于 3。 

用 来 计算 CCD(a,, a, ) 的 欧 凡 里 得 算法 是 计算 余数 序列 mw，a ，…，a,， 其 中 对 于 所 有 的 i22, 
afea, BRA ai_: 的 非 零 余数 ， 且 a, BRE a 的 余数 为 0( 例 如 a,, =O), BRA CCD(a,, a,) =a,, 

例 8.8 在 上 面 的 例子 中 ,ao 257, a, =33, a, =24, a =9, a,-6 Ña, 23, 由 此 , k=5 
B GCD(S7, 33) =3。 口 

定理 8. 15 欧 几 里 得 算法 正确 计算 GCCD(ao，ai ) 。 

证 明 : 算法 计算 a, =0,.,-9,0,, HP l<i<k, g,=La;_,/a,], BX a, <a, MAURER 
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定 能 够 终止 。 而 且 任 何 a,_, 和 a 的 因子 都 是 a,,, 的 因子 ,任何 a, 和 ,的 因子 也 是 a, ,的 因子 。 所 
LI GCD(a,, a,) =GCD(a,, a) =…=GCD(a, ,, a,). AA GCD(a, ,, 6) 是 a,， 所 以 结论 成 
立 。 口 

欧 几 里 得 算法 的 扩展 不 但 可 以 用 来 找 ce 和 ai 的 最 大 公 因子 ， 还 可 以 计算 整数 * My, HEN 
满足 ax + ay = GCD(a。，a,)。 算 法 如 下 。 

算法 8.6 扩展 的 欧 几 里 得 算法 。 

输入 : TERR a, All a。 

输出 : GCD(a,, a, ) 和 满足 aox + ay  GCD(a,, a,) ORE x My, 

Aik: 执行 图 8-6 中 的 程序 。 口 


xod yet 0x; Oy e bil 


white a, 除 以 a, 余数 不 为 0 do 


q © landaj; 

Ci+ — Gi- — q * 4; 
tm — Ga qd * X5 
Yiri Yer — 4 * Yi; 
1 itl 


end 
write a,; write x,; write y, 
end 





图 8-6 扩展 的 欧 几 里 得 算法 
例 8.9 如 果 o =57, a, =33， 则 可 以 得 到 下 面 的 «A yA. 





注意 57 x(- 4) +33 x7 =3。 口 
由 于 a 很 清楚 地 形成 了 余数 序列 ， 所 以 很 显然 ， 算 法 8. 6 正确 地 计算 出 了 GCD(a。，a,)。 算 
法 8. 6 中 计算 的 x. 和 y, 有 一 个 非常 重要 的 属性 将 在 下 面 这 个 引 理 中 讲 到 。 
引 理 8.4 在 算法 8.6 中 ,对 于 i>0,， 有 
Gx, + Gy, = a, (8-23) 
A: 当 i=0 和 i=1 时 ， 由 算法 8.6 的 第 1 行 可 知 ， 公 式 (8-23) 成 立 。 假 设 式 (8-23) 对 i- 
1 和 i 成 立 ， 那么 由 算法 第 5 行 有 zx,, =x,_, ~ gx;， 由 算法 第 6 行 有 y,,, my a -gy;。 所 以 
Aoki + Gil = AX, + Gil 7 g(aox; + a1y;) (8-24) 
由 归纳 假设 和 式 (8-24) ， 有 
Qoi + G,yY,, = Gi, ~ qa, 
因为 由 第 4 行 可 得 ai - qa, =a,,,， 所 以 结论 得 证 。 口 
注意 ,虽然 算法 第 3 行 保证 算法 8.6 确实 计算 出 了 GCD( a。，a,) ， 但 是 引 理 8. 4 并 不 依赖 于 
算法 第 3 行 中 4 的 计算 方法 。 把 这 些 观察 结果 综合 起 来 可 得 到 下 面 的 定理 。 
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定理 8.16 H3HE8.6i-#B GCD(a,, a,), Rx My WH aux cay 2 GCD(a,, a). 

证 明 : 应 用 引 理 8. 4 的 基本 练习 。 口 
现在 介绍 一 些 在 下 一 节 中 用 到 的 概念 。 

定义 : 假设 ao 和 ai 是 整数 ， 其 余数 序列 为 ae，a ，…，aue Hq, =la,_,/aj, HP 1<i<k, 
XX2x2J38RE Ri RR, KpOsisjsk, a, fna, 事先 确定 如 下 : 


1. 对 于 i>0， &,-[. jJ 


ol 0 1, [0 1 0 1 
2. du j»i, BAR =| LIP ag ttl ja 


例 8. 10 假设 a。=57，a, =33， 其 余数 序列 为 57，33，24, 9，6，3， 商 为 g.(1<i<4) 分 
HAL, 1,2, 1, BBA 


eee 4 GR GRÉ AER) 9 
下 面 引 理 给 出 这 些 和 矩阵 的 两 个 属性 。 
引 理 8.5 


a; _ a; 22. 
a) =R; , 其 中 1 <] <k, 
Gil Gia 


b)Ry=[" |], 其中 0<j<h, 
Nir Yja 

其 中 a;，zx; 和 y, 和 扩展 欧 几 里 得 算法 中 的 定义 相同 。 

证 明 : 基本 归纳 练习 。 口 

应 该 注意 到 ， 经 过 下 面 修改 之 后 ， 本 节 中 的 所 有 结论 不 仅 对 整数 ， 对 一 元 多 项 式 也 成 立 。 
很 显然 ， 两 个 整数 的 最 大 公 因 子 是 唯一 的 ; 而 对 多 项 式 而 言 ， 其 最 大 公 因 子 只 有 忽略 常量 乘 数 才 
是 唯一 的 。 也 就 是 说 ， 如 果 g(*) 整 除 多 项 式 oo(x) 和 a (*) ， 这 两 个 多 项 式 的 其 他 因子 也 能 够 整 
除 g(x) ， 那 么 对 于 所 有 的 常量 和 关 0，cg(x) 都 满足 这 一 性 质 。 我 们 将 满足 于 找到 能 够 整除 ao(x) 
和 o(x) 并 且 能 够 被 所 有 其 他 因子 (多 项 式 ) 整 除 的 任意 多 项 式 即 可 。 为 了 唯一 性 ， 可 以 (但 不 ) 
坚持 最 大 的 公 因子 是 首 项 系数 为 1 的 ， 即 最 高 次 项 的 系数 为 1 的 多 项 式 。 


8.9 多 项 式 GCD 的 渐 近 快速 算法 


针对 整数 的 算法 需要 处 理 一 些 特殊 的 细节 ， 所 以 ， 我 们 首先 讨论 多 项 式 的 最 大 公 因子 算法 。 
假设 ao(*) 和 a,(x) 是 两 个 需要 计算 最 大 公 因子 的 多 项 式 ， 且 假设 DEG(o (z)) <DEG(ao(x) ) 。 
这 个 条 件 可 以 通过 如 下 方式 强制 满足 。 如 果 DEG(a。) = DEG(a,) , 那么 把 多 项 式 a。 和 a 用 a 和 
a BE a 替换 ， 也 就 是 余数 序列 的 第 2 和 第 3 项 ， 再 从 这 里 开始 处 理 。 

把 问题 分 为 两 部 分 。 第 一 部 分 设计 算法 获取 余数 序列 的 最 后 一 项 ， 该 项 的 次 数 大 于 多 项 式 
a 次 数 的 一 半 。 形 式 化 地 说 ， 假 设 1(i) 是 使 得 DEG( an ) >i 和 DEG( ay, ,,) <i 成 立 的 唯一 整数 。 
注意 ， 如 果 oo 的 次 数 为 x， 那 么 在 假设 DEC(a,) < DEG( a。) 的 情况 下 有 1(i) n -i-1， 原 因 在 
于 ,对 于 所 有 的 i>=1 有 DEG(a,) &DEG(a, ,) -1 成 立 。 

现在 引入 一 个 递归 过 程 HGCD( half CCD), RRA aMMa, PERR R (R880), HHn 
-DEG(a,) > DEG(a,) ,j=1(n/2)， 也 就 是 说 ,a 这 个 余数 序列 最 后 一 项 的 次 数 大 于 ao 次 数 的 
一 半 。 

HGCD 算法 背后 的 规则 是 次 数 为 由 和 d, 的 多 项 式 的 商 仅 依赖 于 被 除数 的 头 2(d, - ,) +1 项 
和 除数 的 头 d, - d, +1 项 ， 其 中 d, > d,。HGCD 定义 如 图 8-7 所 示 。 





oa 
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procedure HGCD(ao a): 1 0 
if DEG(a,) < DEG(a,)/2 then return [o i| 
else 





4 aba". 其 中 m= |DEG(a,)/2] 和 
DEG(c) < m; 
4&a,-b,x"c,, 其 中 DEG(c,) < m; 
comment by 和 b, 是 G6 和 4 的 前 导 项 (leading term). 有 
DEG (bo) = [DEG(ao)/21 和 DEG(b,) — DEG(b,) 
= DEG(ay — DEG(a,); 
R — HGCD(b,, bi); 


€; 

comment e 和 /是 余数 序列 中 的 连续 项 , 它们 的 次 数 最 
大 为 [3m]2), 也 就 是 ae 次 数 的 31/4 ; 
Aye = gum, HA DEGU < Lm/2j; 
fagn h, P DEG) < Lm/2j; 
comment go fl g: 的 次 数 最 多 为 m 十 1， 
S — HGCD{go, £): 
q *- Idle]; 

0 i 
return 5 + [ 4l *R 


图 8-7 过程 HGCD 
例 8.11 设 


p(x) sx + tX +t xd 


p =x -2x «33 -x-7 

假设 要 计算 HGCD(p,, Pr) 如 果 Co =Ppi, 4, =P2, 那么 在 第 2 和 第 3 行 有 m=2， HR 
b, 2x te +x+l, co zx4l 
b, =x -2x €3, c, 9-x-7 


ABA, ÆR 4 行 调用 HGCD(4,, 5,) 。 在 这 一 步 可 以 检查 只 的 值 为 


[ "m 
1 —(x% +43) 
下 一 步 在 第 5 和 第 6 行 ， 计 算 
d =x -2x 433 -x-7 
e = 40° -Tx + 11x +22 
-32 93, 45 
f*-i& -16 ee 
我 们 发 现 L m/2」=1， 所 以 在 第 7 和 第 8 行 可 以 得 到 
go = 4x -TIxt+1l, hy 22 


t 


这 样 ， 在 第 9 行 可 以 得 到 
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在 第 10 行 ,Ld(z)/e(z) ] 的 商 9(z) 为 了 * -二 。 所 以 在 第 11 行 ， 可 以 得 到 如 下 结果 


"b 0b coal sess Lir meg 
o ull -(2- uo 1 (#43)! L- (4-96) a * 1e * i6 
注意 ， 在 p, 和 p, 的 余数 序列 中 ，。 是 最 后 一 项 次 数 超过 p, 一 半 的 多 项 式 ， 所 以 有 
Pi e 
r[^]- a 
WHY 
现在 考虑 HGCD 中 第 4 行 中 计算 的 矩阵 R, R 可 能 为 
《ec20r0 1 
HL m 
FER q (x) Eby, b EG ARCU PUR OU BRR R= RW ,1,。 然 而 在 第 5 行 中 ， 我 们 用 


及 来 表示 从 d fü e 中 产生 的 矩阵 R ooo RP d 是 余数 序列 中 次 数 大 于 30/2 项 中 的 最 后 一 项 。 
我 们 要 说 明 这 两 种 的 表示 方法 都 是 正确 的 。 也 就 是 说 ，Riv = Roe yo 类 似 地 ， 我 们 可 
以 说 明 在 第 9 行 中 的 S 实现 了 给 它 赋值 的 功能 。 也 就 是 说 ， 


S= Rofira) = Roin) 
下 一 个 引 理 蕴涵 了 这 些 结 果 。 
引 理 8.6 id 
fo) = fios + f) (8-25) 
Hp DEGU) <k, AiR 
g(x) = g,(x)x* + g(x) (8-26) 


其 中 ，DEG(g,) <ko (RU q Ag, DIELNE) gC) SALA (4) /e,(*) JR, 7 Ar, PB FO) 
-q(x)g(x) AL (x) -q GO) (X) HRB. WR DEG) >DEG(g) 且 k<2DEG(g) - DEG) [BP 


DEG(g,) >5-DEG(/,)], 那么 


a) q(x) =q, (x) E 

b) 对 于 次 数 是 上 + DEGU) - DEG(g) 或 者 更 高 的 项 ，r(x) 和 r (x) HE, 

证 明 : 考虑 用 普通 的 除法 算法 计算 扩 x) 除 以 g(x*) ， 该 算法 用 FAx) 的 第 一 项 除 以 g(x) 的 第 
一 项 得 到 商 的 第 一 项 。 商 的 第 一 项 乘 以 g(*) ， 然 后 从 f(x) 中 被 减 去 ， 依 此 类 推 。 前 DEGCg) -k 
项 的 产生 不 依赖 于 e (x)。 但 是 ， 商 只 包含 次 数 为 DEG(f) - DEG(g) 的 项 。 如 果 DEG(f) - 
DEG(g) <DEG(g) -k, ERE k «2DEG(g) - DEG(f)， 那 么 商 不 依赖 于 g,(x)。 如 果 DEC(S) 
~DEG(g) <DEG(/) -k， 那 么 商 就 不 依赖 于 f(x)。 但 是 ，DEG(f) - DEG(g) «& DEG(f) -k Æ 
因为 k<2DEG(g) - DEG(f) H DEG(f) > DEG(g)。 所 以 (a) 部 分 命题 成 立 。 对 于 (5) 部 分 ， 类 似 
的 推理 说 明 次 数 为 DEG(f) - (DEG(g) -k) 或 者 更 高 的 项 不 依赖 于 g,(x)。 与 此 类 似 ， 次 数 为 上 
或 者 更 高 的 余数 项 不 依赖 于 f(x)。 但 是 ，DEG(f) - DEG(g) +k>k。 这 样 ，r(x) 和 r(x)** 中 所 
有 项 的 次 数 是 DEG(f) - DEG(g) +k RAEN. 

引 理 8.7 假设 Kx) - f(x (x) g(x) 2g GO g(a), 其 中 ，DEG(f,) < 天 和 
DEG(g,) «k, 4 DEG(f) =n fil DEG(g) « DEG(f) , BA 


a) - REP 
O, (n+k)/21) ~ "OME (n-)/21) 


也 就 是 说 ， 至 少 直到 余数 的 次 数 不 多 于 次 数 的 一 半 时 ，(F，g) 和 (fi ，g') 余 数 序列 的 商都 


O 当然 ， 这 个 计算 也 可 以 放 在 第 S 行 后 面 。 
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是 相同 的 。 
证 明 : 由 引 理 8.6， 商 相同 ， 并 且 对 于 两 个 余数 序列 中 对 应 的 余数 ， 足 够 的 高 次 项 也 相同 。 
口 
定理 8.17 设 ao(x) 和 ai(x) 是 多 项 式 ， 其 中 DEG(ao) =n, DEG(a,) <n。 那 么 HGCD(a,, 
al) = Rio 


证 明 : 直接 对 n 进行 归纳 ,利用 定理 8.7 可 确保 第 4 行 中 RR 为 Ri; 第 9 行 中 的 5 为 
(25,2) o o 
21(F3m/2]) *1,(m) 


定理 8. 18 如果 参数 次 数 最 大 为 hn， 那么 HGCD 8 € 0,(M(n)loga) Hl, HY M(n) AR 
两 个 次 数 为 于 的 多 项 式 相 乘 需要 的 时 间 。 

证 明 : 证 明 n 是 4 的 者 时 的 结果 。 因 为 显然 HGCD 需要 的 时 间 是 非 递减 函数 ， 所 以 定理 对 所 
有 都 适用 。 如 果 DEG(a,) JE 4 HE, ABA 


DEG(b,) = J DEG(a) 和 DEG(g,) < jDEG(a,) 
如 此 ， 当 HGCD $8 A Jg n 次 时 ， 则 存在 常数 c 使 时 间 T( n) 的 上 界 满足 
T(n) « 21( 7) cM(n) (827) 


也 就 是 说 ，HGCD 过 程 体 涉及 两 次 对 自身 的 调用 ， 且 调用 参数 是 原 参 数 大 小 的 一 半 和 常数 次 的 其 
他 操作 ， 这 些 操作 的 时 间 复 杂 度 是 0, (n) 或 者 是 0,(M(n) ) 。 式 (8-27) 的 求解 大 家 很 熟悉 。 
LF c,M(n)logn, ¢, 是 常数 。 

下 面 构造 一 个 完备 的 求解 最 大 公 因 子 的 算法 。 用 HGCD 计算 R mo HEX RU, "n 
Ry nate 其 中 是 输入 的 次 数 。 

算法 8.7 GCD 算法 。 

输入 ; EMA p (x) p(x), HH DEG(p,) <DEG(p,). 

输出 : 多 项 式 p, 和 p, 的 最 大 公 因 子 GCD(p,, p) o 

方法 : 用 调用 GCD(p,，p,) ， 其 中 CCD 是 图 8-8 的 递归 过 程 。 口 


procedure GCD(a,, a): 
if a, 整除 a, then return a, 
else 


begin 
R € HGCDí(a,, a); 





图 8-8 GCD 过 程 


$418.12. 接着 例 8.11。 其 中 p(x) 2x +r ex +x +1 Ap, (x) za'-2x «33 -x-7, 已 
经 计算 得 到 


1 - (x +3) 
HGCD(p, ,p;) -| 1 11 13 
(和 
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那么 在 第 3 行 计算 得 到 5, = 40 -7x 4 lla +22 Mb, = - 2o - By -Fo RUT EBL bh 不 能 整除 


16 16 
boo FERS TTF, A 
bymodb, = 3952x + 3952 


因为 后 面 一 项 除 以 - a? -5z ~ 分， 在 第 6 行 中 对 CCD 的 调用 在 第 1 行 结束 ， 并 且 得 到 3952s 


+3952 作为 结果 。 当 然 ,x* +1 也 是 p, 和 p, 的 最 大 公 因 子 。 口 


如 果 能 够 证 明 算 法 8. 7 是 可 终止 的 ， 则 其 正确 性 是 很 显然 的 。 算 法 时 间 复 杂 度 的 分 析 蕴 涵 了 
算法 的 正确 性 ， 也 就 是 下 面 这 个 定理 。 


定理 8. 19 如 果 DEG(p,) =n, 那么 算法 8.7 3 O,(M(n)logn) 时间， 其 中 Mn) ERA 
个 次 多 项 式 相 乘 需要 的 时 间 。 
证 明 : 不 等 式 
T(n) « T(7-)* c, M(n) + ¢,M(n) logn (8-28) 


描述 了 算法 8.7 需要 的 运行 时 间 ， 其 中 c 和 是 常数 。 也 就 是 说 已 的 次 数 少 于 ao 次 数 的 一 半 ， 所 

以 式 (8-28 ) 的 第 1 项 表示 第 6 行 中 递归 调用 需要 的 时 间 。 项 c,M(n) 表 示 在 第 1，3, 4 和 35 行 的 

除法 和 乘法 操作 需要 的 时 间 ， 最 后 一 项 表示 在 第 2 行 中 对 HGCD 的 调用 需要 的 时 间 。 很 容易 就 可 

以 得 到 式 (8-28) 的 解 ， 它 的 上 界 是 kM(n)logn， 其 中 是 常数 。 口 
推论 : 两 个 次 数 最 大 为 n 的 多 项 式 的 CCD 可 以 在 0, (nlog*n) 时 间 内 计算 得 到 。 


8.10 ”整数 的 GCD 
这 节 中 要 讨论 CCD 和 HCCD 的 修改 ,使 之 适用 于 整数 。 为 了 搞 清楚 整数 情况 下 的 问题 ， 首 


先 看 引 理 8.6。 引 理 8. 6 说 明 当 计 算 n 次 和 n-d 次 多 项 式 的 商 时 ， 不 需要 次 数 少 于 n -2d 的 项 。 
和 引 理 8.6 类 似 ， 考虑 两 个 整数 g AS, 其 中 F>g， 把 上 和 8 分 别 写成 f=f.2: +h Me =2,2' 


+g,, HPS, <2' Mg, <2', SS AME DEG(g (x)) SF DEG, (2), (REA «(a^ BA, 
可 以 设 f=gg +r AMS, -qug tro 把 这 些 公式 结合 ， 得 到 
&2 (4-4) =f. * n2! - ag, -r (8-29) 
因为 m <&， 卢 <2 关 ， 并 且 所 有 的 整数 都 是 非 负 的 ， 从 式 (8-29) 中 可 以 很 容易 地 得 到 9 -qs 
0。 假 设 存在 m0, fi q=q,-m 成立 。 那 么 从 式 (8-29) 可 以 得 到 


mg,2' «qg, +r = (gq - m)g, +r 


所 以 
mg = mg,2" + mg, S 9,8, +7 (8-30) 
AHAS), Agag. MEREM g «2 和 r<g， 所 以 式 (8-30) 隐 含 
mg < g,2' +g «2g (8-31) 


式 (8-31) 马 上 可 以 得 到 当 m <2 的 情况 。 也 就 是 g=g RB =, - 1, 

在 前 一 种 情况 中 ， 不 存在 问题 。 另 一 方面 ， 如 果 gq = gq, - 1， 我们 不 能 期 望 HGCD 
能 很 好 地 工作 。 幸 运 的 是 ， 只 要 当 商 是 余数 序列 的 最 后 一 个 ,我 们 可 以 得 到 gs. X 
中 余数 序列 的 矩阵 由 HGCD 生成 。 也 就 是 说 ， 如 果 把 g-g,= -1 代入 式 (8-229),， 那 
么 有 

r=f,+ r2' ~ qg: + g,2" (8-32) 
AN r<g=g,2' +8& ， 所 以 可 以 从 式 (8-32) 推 出 mn2 «f, «e, (1 eq), 或 者 r, <1+9g， 也 就 是 mn < gi。 
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Hit, rj ACRUE PUDE FRI es BE, Bene. Ae eV, FUB r < 
VA, RERE HGCD 将 返回 一 个 包含 到 fi/g1 的 商 ( 且 没有 比 这 个 商 更 小 的 项 ) 的 矩阵 。 如 
果 这 个 矩阵 在 HGCD 中 的 第 5 行 中 用 到 ， 那 么 在 第 6 行 中 计算 的 /可 能 不 会 比 a 少 。 然 而 ， 
因为 最 后 商 中 有 一 个 唯一 的 错误 ， 所 以 在 第 6 行 后 ， 扩 展 余 数 序列 到 有 限 数量 (和 ao 大 小 无 
关 ) 使 其 能 够 充分 地 产生 小 于 cy 的 序列 。 在 过 程 中 第 5 行 后 需要 对 CCD 进行 类 似 的 “ 修 
TE”. 

涉及 引 理 8. 6 的 另外 一 个 问题 是 ， 在 多 项 式 下 ， 我 们 能 够 说 明 由 考虑 多 项 式 统一 组 成 的 余数 
序列 和 完整 的 多 项 式 形成 的 序列 的 特定 的 高 次 项 是 相等 的 。 即 使 9 = q, ， 类 似 的 结果 在 整数 情况 
TERZ. Am, ARE r 和 7,2* 之 间 的 区 别 限 定 在 2:(g +1) 范 围 内 ; 我 们 不 能 确定 特定 位 的 
和 7,2* 都 相同 。 尽 管 如 此 ,“ 舍 人 误差 ”( rounding error) 会 引起 在 HGCD 第 6 行 后 和 GCD 第 5 行 后 
需要 有 限 数量 的 余数 序列 的 补充 项 。 

假设 M(n) 表示 n 位 数 乘法 需要 的 时 间 ， 扩 展 余数 序列 所 需要 的 额外 代价 限制 在 0,(M(n)) 
范围 内 ， 所 以 HGCD 和 GCD 的 时 间 分 析 基 本 不 受到 影响 。 由 此 有 如 下 定理 。 

定理 8.20 如 果 M(n) 表 示 两 个 位 数 乘 法 需要 的 时 间 ， 那么 ， 存 在 一 个 算法 能 够 在 
Os(M(n)log n) 时 间 内 找到 整数 ao 和 a 的 最 大 公 因 子 GCCD(ao，ai) 。 

证 明 : 基于 上 面 对 过 程 HGCD 和 CCD 的 修改 建议 ， 这 个 证 明 过 程 留 作 练 习 。 Li 

推论 ”能够 在 Os(nlog'nlog log n) 时 间 内 找到 整数 的 最 大 公 因 子 。 


8. 11 再 论 中 国 余数 


现在 再 来 看 GCD 算法 如 何 运 用 于 渐 近 快速 且 无 需 预 备 好 的 整数 的 中 国 余数 算法 的 设计 
中 。 回 想 前 面 预备 好 的 算法 8.5， 需 要 08(MH( 上 站 )logk) 时 间 才 能 从 大 个 5 位 的 模 上 重 构 uo 
问题 是 计算 d; = (p/p.) p, APE p, pis cos pu UE, p 是 它们 的 乘积 。 

利用 分 治 算法 ， 可 以 在 O,CM Cb) logk) BT [8] At ZG ROSTER. p; 的 乘积 ， 然 后 计算 四 个 
p, 的 乘积 等 等 ， 用 这 样 的 方法 计算 p。 算 法 8. 5 的 技术 使 我 们 能 够 在 无 需 预 先 计算 的 条 件 下 ， 在 
Os(M(bk)log) 步 内 计算 e, = (p/p,) 模 p.(0<i<k)。 剩 下 的 就 是 确定 计算 d, =e， Bp, 需要 的 时 
间 了 。 

因为 p/p, 是 除了 p; 外 其 他 模 的 乘积 ， 所 以 它 和 p, 是 互 质 的 。 存 在 一 个 整数 gq9， 如 果 把 p/p, 
表示 为 qp, +e, JA e; Mp, 是 互 质 的 ， 也 就 是 GCD(e,,p;) =1。 由 此 ， 给 定 x fly, 使 ex +p,y 
=1， 有 ex=1 模 p,。 也 就 有 x=e; =d, 模 p, 成 立 。 扩 展 的 欧 几 里 得 算法 就 是 计算 这 样 的 x Hy. 

设计 CCD 过 程 的 目的 仅 是 用 来 计算 GCD(p, ，p,) ， 而 设计 HGCD 则 是 计算 矩阵 Rois. Hi 
Jt, Xf CCD 算法 进行 一 些小 的 修改 可 以 生成 Roo,。 因 为 它 将 是 和 矩阵 的 左上 元 素 ， 所 以 有 可 能 取 
得 x。 现 在 可 能 确定 没有 预先 计算 的 中 国 余数 算法 需要 的 时 间 。 

定理 8.21 给 定 上 个 总 位 模 ， 在 整数 情况 下 ， 中 国 余数 算法 需要 的 时 间 是 O,( M (bk) logk) 
+ 0,(kM(b) logb) . 

证 明 : 通过 以 上 分 析 ， 第 1 项 表示 e: 的 计算 和 执行 算法 8. 5 需要 的 时 间 。 因 为 x 和 y 的 计算 
都 允许 5 位 算术 的 模 p; 计算 ， 所 以 第 2 项 表示 计算 d, 的 时 间 。 口 
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Hil 无 预先 准备 的 中 国 余数 算法 需要 时 间 最 多 为 O, bklog bkloglogbk) ° 。 
8.12 ”稀疏 多 项 式 


前 面 所 使 用 的 一 元 多 项 式 表 示 基 于 多 项 式 ?joasx' 是 稠密 的 这 一 假设 ， 也 就 是 说 几乎 所 有 的 多 项 
式 系数 都 是 非 0 的 。 在 许多 应 用 中 假设 多 项 式 是 稀 朴 的 ， 也 就 是 说 非 0 系数 个 数 远 少 于 多 项 式 的 
最 高 次 数 。 在 这 种 情况 下 多 项 式 的 逻辑 表示 是 数 对 (a,, 广 ) 的 列表 ， 由 非 0 系数 和 x HO 
组 成 。 

由 于 不 可 能 对 所 有 处 理 稀 朴 多 项 式 的 算术 运算 技术 面面俱到 ， 这 里 仅 涉 及 两 个 比较 有 趣 的 
理论 。 第 一 ， 在 这 种 情况 下 ， 使 用 傅 里 时 变换 做 乘法 运算 是 不 合理 的 ， 将 给 出 一 种 合理 的 计算 稀 
杖 多 项 式 乘 法 的 技术 。 第 二 ， 通 过 计算 [p(x) ] 说明 笛 密 和 稀疏 多 项 式 的 算术 操作 存在 着 很 大 的 
差异 。 

大 多 数 合理 的 处 理 稀 玻 多 项 式 乘法 的 已 知 方法 是 把 多 项 式 允 "ax 表示 为 数 对 的 列表 (ai， 
A), ，(a , 户 ) ，…，(a, 记 ) ， 其 中 假设 7 是 不 同 的 且 按 照 降序 排列 ， 即 对 于 1<i<n, 5Ahao 为 
了 把 两 个 这 种 方法 表示 的 多 项 式 相 乘 ， 先 计算 数 对 的 乘积 并 且 按 照 它们 的 指数 ( 数 对 中 的 第 二 个 
分 量 ) 大 小 排列 这 些 结果 项 ， 然 后 把 具有 相同 指数 的 项 合并 。 不 这 样 做 的 后 果 是 会 增加 许多 具有 
相同 指数 的 项 。 这 种 情况 下 ， 如 果 在 每 一 步 算术 操作 都 进行 合并 项 操作 ， 随 着 越 来 越 多 的 算术 操 
作 ， 所 需要 的 代价 就 会 大 大 超出 原来 的 情况 。 

如 果 对 排序 后 的 稀 朴 多 项 式 做 乘法 ， 可 以 利用 两 个 事实 使 乘积 的 排序 变 得 尽 可 能 简单 ， 其 
一 是 它们 是 有 序 的 ， 其 二 是 其 中 一 个 的 项 比 另外 一 个 多 得 多 。 下 面 设计 一 个 非 形式 的 算法 按照 
RATE BRS TTE] E T 

算法 8.8 有 序 稀疏 多 项 式 乘 法 。 

输入 : 多项式 


Ax) = Soa! Ales) = Yos 
表示 为 数 对 列表 
(a, JG) 7, (On adn) fi C5, , E, ) ,(5,, ke, ) , (b, k.), 
Hp j 和 天 是 单调 递减 的 。 
输出 : 


Lo = f(x)g(x) 

用 数 对 列表 表示 ， 其 中 1 是 单调 递减 的 。 

方法 : KRR, Bittman, 

1. 对 l<isn, 构造 5, 序 列 ， 其 中 第 7 项 是 (a,6;, jk) Osram), ERER SRR f(x) 
和 g(x) 第 i 项 的 乘积 ; 

2. NT 1sisn/2, 通过 项 的 合并 把 5,,_, 序 列 和 5; 序列 合并 。 然 后 按 对 把 结果 序列 项 合并 ， 
一 直 重 复 这 一 过 程 直 到 只 剩 下 一 个 有 序 的 序列 。 
定理 8. 22 d mehW, 算法 8.8 需要 O(mnlogn) Ho, 
证 明 : 第 1 步 肯定 需要 的 时 间 为 O( mn) 。 第 2 步 重复 执行 [ logn | 次 ,每 次 需要 O( mn) 时 间 。 





© 注意 很 有 趣 的 一 个 现象 是 M(n) = njognloglogn， 这 个 数字 是 从 定理 8.21 中 可 以 得 到 的 最 好 情况 ， 它 和 5、 
无 关 。 

仿 ” 注 意 这 里 使 用 RAM 复杂 度 而 不 是 算术 复杂 度 ， 因 为 即使 m fü 是 固定 的 ， 算 法 8. 8 的 程序 中 分 支 转移 也 是 固 
有 的 。 
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现在 来 看 算法 8. 8 Ke Hat fas Ze E Io RE EUIS D e HT OR BE S 

例 8. 13 ”现在 考虑 计算 多 项 式 广 (*) ， 其 中 pP(x*) 是 有 nm DRIED, CECHSIBURUBE E DERIT 
况 。 当 给 定 的 p(x) 是 稠密 多 项 式 时 ， 那 么 计算 p'(%) 的 最 好 方法 是 通过 两 次 平方 的 计算 。 也 就 是 
说 假设 M(n) 是 两 个 稠密 多 项 式 相 乘 需 要 的 时 间 为 cn log n, 那么 ， 可 以 在 cnlog n 步 内 计算 出 
p. (x) ,并 且 在 2cnlog 2n 步 内 计算 出 这 一 结果 的 平方 ， 所 以 总 共 需 要 3enlog n +2cn 步 。 与 之 进行 
比较 ， 如 果 按 照 p=p x (p x (p xp) ) 的 方式 计算 p'(x) ， 那 么 在 计算 pxp? 需要 2M(n) 步 ,计算 
pxp 需要 3M(n) 步 的 假设 下 ， 总 共 需 要 的 时 间 很 显然 是 6cnlog "。 那 么 对 于 稠密 多 项 式 ， 我 们 希 
18 p' 是 通过 两 次 平方 的 方式 计算 得 到 。 

现在 假设 p(x) 是 有 n 项 的 稀 朴 多 项 式 。 如 果 利 用 算法 8. 8 RCP’) 的 方式 计算 ， 则 第 一 次 
平方 需要 的 时 间 是 cn’ log n， 在 假设 只 有 很 少 项 可 以 合并 的 情况 下 ,第 二 次 平方 需要 时 间 
en'log rn。 那么 整个 计算 过 程 需要 花费 c(2n' + rw )log n 时 间 。 利 用 另外 一 种 方法 ， 按 照 p' =p x 
(px (p xp) ) 计 算 ， 则 总 共 需 要 cn?log n+ cn'log n. +cn‘log n 2 c(n* +n’ +n?) log nn 时间。 这 个 时 
间 比 两 次 平方 需要 的 时 间 更 少 。 由 此 可 以 看 出 ， 通 过 两 次 平方 的 方法 并 不 总 是 计算 稀 朴 多 项 式 
p (x) 的 好 方法 。 如 果 计 算 pr” ， 那 么 这 两 种 方法 之 间 的 区 别 会 更 明显 ， 其 中 i 是 一 个 大 的 整数 。 


习题 


8.1 ”利用 算法 8.1 计算 429 的 “倒数 ”。 
8.2 ”利用 算法 8.2 1-H 4297, 
8.3 ”利用 算法 8. 3 计算 下 式 的 “倒数 ” 
x! -xi +a -3a! x) -x +2041 

设计 一 个 和 算法 8. 2 类 似 的 算法 来 计算 多 项 式 的 平方 。 
利用 习题 8. 4 中 编写 的 算法 计算 (x -x +x -2)?。 
利用 算法 8. 4 寻求 1 000 000 的 表示 ， 其 中 模 为 2, 3, 5, 7, 11, 13, 17, 19, 
编写 一 个 完整 的 算法 以 计算 多 项 式 模 一 组 多 项 式 模 (a collection of polynomial moduli) 的 余数 。 
计算 +308 40° +3x 407 41 Bi 43, oP -3x 41, 妈 +x-2 和 入 -1 的 余数 。 
习题 8. 8 中 的 多 项 式 是 通过 仔细 挑选 过 的 ， 你 可 以 通过 手工 计算 得 到 结果 。 随 机 选择 次 数 
为 1、2、3、4 的 四 个 多 项 式 ， 并 且 计 算 * -4 除 以 这 4 个 多 项 式 的 余数 ， 结 果 如 何 ? 
假设 5、6、7、11 是 四 个 模 ， 找 一 个 小 于 它们 乘积 的 数 u, 使 we>(1,2, 3, 4)。 
推广 引 理 8. 3 ， 运 用 到 任意 的 多 项 式 模 上 ， 且 这 些 模 的 根 已 知 或 者 可 以 找到 (例如 次 数 小 
于 5 的 多 项 式 ) 。 分 析 一 下 中 国 余数 多 项 式 在 利用 你 编写 的 算法 作为 计算 数 或 者 模 的 次 数 
的 函数 时 的 复杂 度 。 
寻找 一 个 多 项 式 ， 要 求 它 在 0、1、2、3 的 值 分 别 是 1、1、2、2。 
寻找 下 面 两 个 多 项 式 的 最 大 公 因 子 ， 

a5 430° 4328 +x -x -x-1 

xo 420 4064209 42x +041 
习题 8. 13 中 的 多 项 式 是 通过 挑选 的 ， 可 以 通过 手工 计算 得 到 答案 。 选 择 次 数 为 ?， 和 8 的 
任意 两 个 多 项 式 ， 计 算 它们 的 最 大 公 因子 。 结 果 如 何 ? 你 怀疑 得 到 的 最 大 公 因 子 吗 ? 
设计 一 个 完整 的 算法 ， 用 于 计算 整数 的 最 大 公 因 子 ， 要 求 该 算法 对 n 位 整数 的 运行 时 间 在 
O, (n log/n log log n) A, 
利用 习题 8. 15 所 设计 的 算法 计算 GCD(377, 233), 
假设 P(x) 是 一 个 稀疏 m 次 多 项 式 。 编 写 一 个 n 的 函数 ， 能 够 决定 计算 p (x) 的 最 好 方法 ， 
其 中 所 用 的 乘法 为 算法 8. 8。 
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*8.18. ”下面 是 计算 多 项 式 扩 xz)/g8(x) MK, Be MRS, Of Ae 是 次 数 少 于 或 等 于 n-1 
的 多 项 式 。 
(1) 分 别 计算 上 和 g 的 离散 傅 里 叶 变换 正和 CG, 
(2) 把 屎 中 的 项 分 别 除 以 C 中 的 对 应 项 ， 得 到 序列 五 。 
(3) 对 互 实 现 逆 变 换 ， 得 到 结果 f/g。 这 个 算法 是 否 有 效 。 
**8.19. 假设 M(n) 3€ ”位 数 相 乘 需要 的 时 间 ，Q@(n) 表 示 由 n 位 整数 ;计算 Li 的 时 间 。 假 设 当 
az>1 时 ，M(on) ZaM(n) RE, Xt Q(n) 也 类 似 。 证 明 M(n) 和 O(n) 关于 常数 因子 是 相等 
的 。 
*8.20 ”把 习题 8. 19 4E] Sl (a) 多 项 式 情 况 和 (及 对 固定 的 >， 求 次 方 根 。 
*8.21.— 给 定 计算 某 点 (nm - 1) 次 多 项 式 及 其 该 点 的 所 有 导数 值 的 算法 ， 要 求 其 复杂 度 
380, (n log n); 
** 8.22 个 变量 2 的 稠密 多 项 式 可 以 表示 为 
了 
WEH, Æx ma, x, ma^, ce, x, = 地 这 些 点 上 进行 计 值 和 插值 操作 ， 可 以 在 0,(mlogn) 
时 间 内 计算 这 类 多 项 式 的 乘法 ， 其 中 0<j, <21, w 是 主 2n 次 单位 根 。 
性 8.23 ”证明 通过 对 MWH(n) 和 了 (mn) 平 滑 度 上 的 合理 假设 ，r 个 变量 的 稠密 多 项 式 乘法 和 除法 计算 需 
要 的 时 间 M(n) fl D(n) ， 差 别 在 一 个 常量 因子 之 内 。 
**8.24. 设计 一 个 算法 能 够 在 0,(n log*n log log n) 时间 内 ，a) 把 ”位 二 进 制 数 转换 为 十 进 制 数 ; 
b)n 位 十 进 制 数 转换 为 二 进 制 数 。 
**8.25. 整数 (多 项 式 )x 和 y 的 最 小 公 倍 数 (LCM) 是 z( 多 项 式 情况 下 可 能 有 多 个 z) ， 其 中 最 小 公 | 
倍数 :能够 被 x 和 7 整除 ， 也 能 够 被 * 和 y 的 其 他 整数 ( 多项式) 整除 。 证 明 计算 两 个 位 | 
数 的 LCM 所 需要 的 时 间 至 少 与 两 个 ” 位 数 相 乘 需要 的 时 间 相同 。 | 
8.06 使 用 2.6 节 中 整数 乘法 的 方法 是 否 能 够 产生 0, (n°) 时 间 的 多 项 式 乘法 算法 ? 
8.27 证 明 可 以 在 0,(n log n) 步 内 对 (n - D CERE a, ah, se, a HB. CR. 证 明 | 
存在 函数 /和 8 ， 可 以 把 = X ba BRR = X GDaG- D.) 
8. 28 证 明 可 以 在 0,(n log n) 步 内 对 (n -1) 次 多 项 式 ba? + ca’ +d(0<j<n) 在 n 点 上 计 值 。 
8.29 ”设计 算法 8.4 和 8.5 的 递归 版 本 。 


研究 性 问题 


8.30 本 章 证 明 大 量 多 项 式 和 整数 问题 是 
i) 本 质 上 具有 相同 的 乘法 复杂 度 ， 或 者 
ii) 最 多 差别 为 比 乘法 更 复杂 一 个 log AF. 
这 类 问题 在 本 章 的 习题 中 有 。 习 题 9.9 给 出 了 另外 一 个 组 (ii) 中 的 问题 ， 即 “与 或 " 乘 。 
一 个 合理 的 研究 问题 是 添加 问题 到 (i) 或 者 (ii) 中 。 另 外 一 个 方面 就 是 证 明 一 些 在 (ii) 中 的 
问题 在 本 质 上 有 相同 的 复杂 度 。 例 如 : 可 以 猜想 对 于 GCD 和 LCM 其 是 正确 的 。 
8.31 另外 一 个 看 似 简 单 的 问题 是 ， 对 有 序 稀 朴 多 项 式 乘法 确定 算法 8. 8 是 否 产生 有 序 结果 的 最 
好 算法 。Johnson [1974] 对 这 个 问题 做 了 一 定 的 研究 。 
8.32 ”这 里 描述 的 许多 算法 在 实际 应 用 中 要 求 ”的 值 非常 大 。 然 而 ， 对 于 小 的 nm， 可 以 结合 2.6 
节 提 到 的 O(n^7) 的 方法 和 习题 8. 26 提 到 的 0(n?) 的 方法 ， 以 及 显而易见 的 O(n?) HE 


加” 随 着 " 越 来 越 大 ， 笛 密 假设 就 变 得 越 来 越 没 意义 。 











EKA $3 AA 195 


结合 。 对 于 小 于 某 个 上 界 的 n， 比 本 章 叙 述 的 技术 有 更 好 性 能 的 算法 。Kung [1973 ] 做 过 
一 些 这 方面 的 工作 。 


文献 与 注释 


定理 8. 2 计算 倒数 不 会 比 乘法 的 计算 更 难 这 一 事实 是 由 Cook [1966] 发 现 的 。 奇 怪 的 是 ， 类 
似 的 多 项 式 算 法 在 几 年 内 没有 实现 。Moenck 和 Borodin [1972] 提出 了 一 个 除法 算法 ， 只 需 
要 0, (nlog’nlog log n) 时 间 。 稍 后 有 几 个 人 , 包括 Sieveking [1972]， 独 立地 提出 了 需要 
O, (n log n log log n) 时 间 的 除法 算法 。 

模 运 算 、 插 值 和 多 项 式 计 值 算法 的 发 展 主要 是 Moenck 和 Borodin[ 1972] 的 工作 。Heindel 和 
Horowitz [1971] 发 现 了 需要 O, (nlog nlog log n) 时 间 的 基于 预计 算 的 中 国 余数 算法 。Borodin 和 
Munro [1971] 提 出 了 一 个 0(n"”) 时 间 的 多 项 式 多 点 计 值 算法 ，Horowitz [1972] 把 这 个 算法 扩展 
到 插值 中 。Kung [1973 ] 提 出 了 一 个 0,(n log’ n) 时 间 的 多 项 式 计 值 算法 ， 不 使 用 快速 的 (n log n) 
除法 算法 。 中 国 余数 、 插 值 、 多 项 式 计 值 和 整数 余数 的 计算 综合 在 Lipson [1971] 中 叙述 。 

O, (nlog'n log log n) 时 间 的 整数 最 大 公 因子 算法 是 由 Schonhage [1971 ] 提 出 的 ， 其 适用 于 多 
项 式 和 一 般 的 欧 几 里 得 域 由 Moenck [1973] 提 出 。 

经 典 的 最 大 公 因 子 技术 的 概述 见 Knuth [1969] 。 关 于 稀疏 多 项 式 复杂 度 的 材料 实例 由 Brown 
[1971]. Gentleman [1972 ] 和 Gentleman 和 Johnson [1973 ] 提出 并 进行 研究 。 多 项 式 算 术 的 计算 机 
实现 由 Hall [1971], Brown [1973] 和 Collins [1973 进行。 算法 8. 8 的 基于 堆 数 据 结 构 的 实现 由 
S. Johnson 在 ALTRAN [ Brown, 1973 ] 完 成 。 

习题 8. 19 和 8. 20 H R. Karp #1 J. Ullman 提出 。 习 题 8. 21 中 的 多 项 式 计 值 及 其 导数 的 计算 
分 别 由 Vari [1974] 和 Aho, Steiglitz 和 Ullman [ 1974] 提出 。 习 题 8. 28 则 稍 后 形成 。 习 题 8. 27 则 


由 Bluestein [ 1970] 和 Rabiner, Schafer 和 Rader [1969] 提出。 多 项 式 和 整数 算术 处 理 的 扩展 由 
Borodin 和 Munro [1975] 发 现 。 








第 9 章 模式 匹配 算法 


模式 匹配 是 许多 文本 编辑 、 数 据 检索 和 符号 操作 问题 的 重要 组 成 部 分 。 在 典型 的 字符 串 匹 
配 问题 中 ， 一 般 会 给 定 文本 串 x 和 模式 串 集合 1y, ，yY, ，… 1 ， 要 求 定位 模式 中 在 x 中 的 一 次 出 现 
或 所 有 的 出 现 。 模 式 集合 通常 是 用 正则 表达 式 表示 的 正则 集合 。 本 章 将 给 出 几 个 解决 模式 匹配 
问题 的 相关 技术 。 

本 章 首 先 回顾 一 下 正则 表达 式 和 有 穷 自 动机 的 概念 ， 然 后 给 出 在 串 x 中 查询 子 串 y 的 出 现 的 
算法 ， 子 串 y 属于 给 定 的 正则 表达 式 所 表示 的 集合 。 算 法 运行 的 时 间 复 杂 度 与 4 的 长 度 和 正则 表 
达 式 长 度 的 乘积 属于 同一 数量 级 。 接 下 来 给 出 一 个 线性 算法 用 于 确定 字符 串 y 是 否 为 字符 串 * 的 
子 串 。 在 这 之 后 ， 给 出 一 个 功能 强大 的 理论 结果 : 任何 能 够 用 双向 确定 型 下 推 自动 机 解决 的 模式 
识别 问题 都 能 够 用 RAM 在 线性 时 间 内 解决 。 因 为 下 推 自动 机 可 能 需要 二 次 禾 或 甚至 指数 数量 级 
的 时 间 复 杂 度 ， 所 以 这 个 结论 很 重要 。 本 章 最 后 介绍 位 置 树 (position tree) 的 概念 ， 并 将 这 个 概念 
应 用 于 一 些 模式 匹配 问题 ， 如 在 给 定 串 中 查询 最 长 重复 子 串 问题 。 


9.1 有 穷 自动 机 和 正则 表达 式 


许多 模式 识别 问题 及 其 解决 方法 都 能 够 用 正则 表达 式 和 有 穷 自 动机 来 表示 ， 因 此 我 们 先 来 
回顾 一 下 相关 内 容 。 

定义 ”字母 表 是 符号 的 有 穷 集合 。 字 母 表 了 上 的 字符 串 是 由 了 上 的 符号 组 成 的 有 限 长 度 的 序 
列 。 空 囊 用 E 表示， 指 没 有 任何 符号 的 字符 串 。 如 果 x 和 7y 是 字符 串 ， 则 zx 和 yy 的 连接 (concate- 
nation) 是 字符 串 xy, WR xyz JE Y HEB, Wx ENAR, y 是 子囊 ，z 是 后 缓 。 字 符 串 “的 长 
度 用 1 x1 RAR, Bx 中 符号 的 总 个 数 。 例 如 ， 字 符 串 aab 的 长 度 为 3; Ee 的 长 度 为 0。 

字母 表 1 上 的 一 个 语言 是 1 上 的 字符 串 的 集合 。 设 L 和 工 是 两 个 语言 ，L,L 称 为 语言 L 和 
的 连接 ， 可 表示 为 {xy| xeL,, yel,|. 

设 工 是 一 个 语言 ， 定 义 忆 = | el, b= (i21), LAX RBM é (Kleene closure) 记 作 
L* ， 是 语言 = UL ,上 的 正 闲 包 记 作 L' ， 是 语言 六 SUL, 

正则 表达 式 和 它们 表示 的 语言 ( 即 正则 集 ) 是 计算 机 科学 的 很 多 领域 中 非常 有 用 的 概念 。 在 
本 章 中 ,我 们 将 看 到 它们 是 关于 模式 的 有 用 的 描述 子 。 

EX 设 1 是 一 个 字母 表 , 7 上 的 正则 表达 式 和 其 表示 的 语言 可 递归 定义 如 下 : 

1) 纪 是 一 个 正则 表达 式 ， 表 示 空 集 。 

2) e 是 一 个 正则 表达 式 ， 表 示 集 合 | e | 。 

3) 对 了 中 的 每 个 a,a 是 一 个 正则 表达 式 ， 表 示人 集合 {el 。 

4) 如 果 忆 和 9 是 正则 表达 式 ， 分 别 表示 正则 集 忆 和 Q@， 则 (pP+9g)、(Pg) 和 (已 ") 也 是 正则 表 
达 式 ， 分 别 表示 集合 PUO、PO 或 和 P*。 

在 写 正则 表达 式 时 ， 如 果 假 设 * 的 运算 优先 级 高 于 连接 运算 或 + 运算 ， 且 连接 运算 的 优先 
级 高 于 + 运算 ， 则 可 以 省 略 许多 括号 。 例 如 ，((0(1 ” ) ) +0) 可 写成 01” +0, RAR pp ' 可 简写 
成 p'。 


AA HCH 197 


$i 9. 1 

1.01 是 正则 表达 式 ， 表 示 集 合 101} 。 

2. (0 +1)" #710, 11", 

3.1(0+1) "1+1 表示 所 有 以 1 开头 和 结尾 的 字符 串 的 集合 。 口 

当 且 仅 当 一 个 语言 能 被 一 个 正则 表达 式 表示 时 ， 定 义 该 语言 为 正则 的 。 如 果 两 个 正则 表达 
式 w 和 有 8 表示 同一 集合 ， 则 称 w 和 有 是 等 价 的 ， 记 作 a=B。 例 如 ，(0+1)" =(0"1")"。 

第 4 章 介绍 了 确定 型 有 穷 自 动机 的 概念 。 这 种 自动 机 可 以 被 看 作 一 个 设备 ， 包 括 一 个 
“控制 器 ” 和 一 个 输入 带 ， 控 制 器 总 是 处 在 有 穷 状 态 集中 的 一 个 状态 下 ， 输 入 带 被 一 个 磁头 
从 左 到 右 扫描 。 确 定型 有 穷 自动 机 根据 控制 器 的 当前 状态 和 输入 磁头 下 的 输入 符号 确定 下 
一 步 的 “移动 操作 ”。 每 次 移动 后 ， 控 制 器 进入 一 个 新 的 状态 ， 且 输入 磁头 向 右 移 动 一 格 。 
关于 有 穷 自 动机 的 一 个 重要 事实 是 当 且 仅 当 一 个 语言 能 被 有 穷 自动 机 接受 时 ， 它 才能 用 一 
个 正则 表达 式 表 示 。 

有 穷 自动 机 的 主要 扩展 是 非 确定 型 有 穷 自 动机 。 对 于 每 个 状态 和 输入 符号 ， 非 确定 型 有 穷 
自动 机 在 下 一 步 移 动 时 有 0 个 或 多 个 选择 。 它 也 可 能 只 改变 状态 ， 而 不 移动 输入 磁头 。 

定义 ”一 个 非 确定 型 有 穷 自动 机 (NDFA)MM 是 一 个 五 元 组 (S$,，1,，8，s。，F) ， 其 中 : 

1)S 是 控制 器 的 有 穷 状态 集 。 

2)7 是 字母 表 ， 输 入 符号 选 自 该 字母 表 。 

3)SERARRBK, BRASx(Ule| RHADSHTRARARS, 

4)S 中 的 so 是 有 穷 控 制 器 的 初始 状态 。 

5)FCS 是 最 终 (或 接受 ) 状 态 集 。 

NDFA M 的 瞬时 描述 (Instantaneous description, ID) 是 一 个 值 对 (s，w)， 其 中 se S$, 表示 有 
限 控制 器 的 状态 ; we 1" ， 表 示 输 入 串 中 没有 使 用 的 部 分 ( 即 输入 磁头 所 在 位 置 右 边 的 符号 串 ) 。 
对 的 初始 ID， 第 一 个 元 素 是 初始 状态 ， 第 二 个 元 素 是 需要 识别 的 字符 串 ， 即 (%，w) ， 其 中 ， 
wel’, MRS ID BPMs, e), 其 中 seF。 

By AA ID 的 二 元 关系 上 表示 NDFA 的 移动 。 如 果 86(s，a) 包 含 状 态 s'， 则 对 于 所 有 中 的 w, 
有 (s，aw) 上 (s', w), EXE, a 可 能 是 e 或 者 是 1 中 的 一 个 符号 。 如 果 a = e ， 则 状态 转换 与 被 
扫描 的 输入 符号 无 关 ( 即 不 管 磁头 扫描 的 输入 符号 是 什么 ,1 的 状态 均 从 ， 转 到 s'。 PER 
iE); 如 果 az e ， 则 a 必须 出 现在 磁带 的 下 一 个 输入 格 上 ， 并 且 输 入 磁头 向 右 移 动 一 格 。 

Fits 上 的 自 反 传递 闭 包 。 如 果 (so。, w) ECs, e), seF, WEK w 可 以 被 MM 接受 。 也 就 
是 说 ， 如 果 对 输入 串 w， 存 在 包含 0 个 或 多 个 移动 的 ID 序列 ， 根 据 这 个 序列 ，M 能 够 从 初始 的 
ID(s。，w) 移 动 到 一 个 接受 ID(s，e ) ， 则 称 输入 串 z 被 1 接受 。M 接受 的 字符 串 的 集合 称 为 M 
接受 的 语言 ， 记 作 L(M)。 

例 9.2 考虑 一 个 非 确定 型 有 穷 自动 机 六， HEX HL a, b 组 成 的 以 aba 结尾 的 所 有 字符 串 ， 
BI L(M) =(a+b) "aba, WMz(lIs, s, s, sl, la, 外 ，56，5，|s)， 其 中 8 的 定义 如 图 
9-1 所 示 ( 这 里 没有 必要 作 e 转换 ) 。 

假设 M 的 输入 是 ababa, M 将 产生 如 图 9-2 所 示 的 ID PRIN, ERC, ababa)|*(s,, €), A 
$4 是 终结 状态 ， 则 M 接受 串 ababa。 口 

和 NDFA 关联 的 是 一 个 有 向 图 ， 这 个 有 向 图 能 够 表达 了 NDFA 的 状态 转换 功能 。 

定义 设计 =(S, 1, 8, s, F) ÉE—^* NDFA, fu M XO IS He M B] (transition diagram) 是 边 
带 标记 的 有 向 图 C= (3$S, E), xb Foeioth e EE XU TU dx IUlel v X^ 4 9a, Ss, 
a)/ 4 s', Wils, SEE P; (s, ) 的 标记 是 1U 1 e | 中 符号 6 的 集合 ,使 得 6(s, b) ies, 
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(5.5) {s1} 
$$ {53} ø 
S3 {s4} j (5) 
$4 ø p {s2} 


9-1 状态 转换 函数 8 


(s; , baba) 一 -一 人 15， aba) ——— (s, , ba) —— (s,, 2) ——P ls. €) 
(s, , ababa) (s; , ba) ———P (ss, a) is; , e) 
(s, , baba) —— (s, , aba) ——— (s. , ba) ls, , e) 


图 9-2 对 应 输入 ababa 的 ID 序列 





图 9-3 例 9.2 的 转换 图 


例 9.3 例 9.2 的 NDFAM 的 转换 图 如 图 93 所 示 ， 双 圈 表 示 终 结 状态 。 口 

用 特定 的 闭 半 环 将 NDFA 的 转换 图 与 图 中 的 路 径 问 题 相关 联 。 设 1 是 字母 表 ，5, = CQ), 
U, +, Ø, lel). H5S.6 HUME, SA-THER, EPPO ) 是 1 上 所 有 语言 的 集 
合 ， 包 是 并 运算 的 单位 ，{ e | ER - 运算 的 单位 。 

定理 9.1 被 非 确定 型 有 穷 自 动机 接受 的 每 个 语言 都 是 正则 集 。 

证 明 : WM=(S,1,5,5,, F)J&—- NDFA, G- (S, EE) 是 相应 的 转换 图 。 对 转换 图 中 的 每 
对 顶点 * 和 ， 应 用 算法 5.5 可 以 计算 出 语言 5, ， 它 是 标记 * 到 *' 的 路 径 的 所 有 字符 串 的 集合 。 
可 以 看 到 ， 转 换 图 每 条 边 的 标记 都 是 正则 表达 式 。 此 外 ， 在 算法 5. 5 中 ， 如 果 计 算 的 集合 C, 也 
是 正则 表达 式 ， 则 根据 算法 的 第 S 行 ， 集 合 C 也 是 正则 表达 式 。 这 样 ， 每 个 语言 上 ,都 能 够 用 正 
则 表达 式 表示 ， 因 此 是 一 个 正则 集 。 根 据 定义 ， 正 则 集 的 并 也 是 正则 的 ， 所 以 Z(M) =U, erly 
一 个 正则 集 。 

定理 9. 1 的 逆 定 理 也 成 立 ， 即 给 定 一 个 正则 表达 式 ， 存 在 一 个 NDFA， 它 可 接受 这 个 正则 表 
达 式 表示 的 语言 。 从 计算 复杂 度 的 角度 来 说 ， 最 重要 的 是 能 够 找到 一 个 NDFA， 它 所 包含 的 状态 
数 不 超 过 正则 表达 式 长 度 的 两 倍 ， 且 所 有 状态 的 后 继 状 态 不 超过 两 个 。 

定理 9.2 如 果 a 是 正则 表达 式 ， 则 存在 一 个 接受 a 所 表示 的 语言 的 NDFA M, M=(S, 1, 
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6，S$o，is) ， 且 M 有 如 下 属性 : 

1. [S] <s21al ， 其 中 1 al 表示 a 的 长 度 。S 

2. 4 IUl el 中 的 每 个 字符 a, 6(s,, a) E ER. 

3. ERARA seS TF, MlUl el PRAN FH a, 8G, a) | 的 和 最 多 为 2。 

EA: 对 a 的 长 度 进行 归纳 。 归 纳 基础 ， 当 | al =1 if, a 必定 是 三 种 形式 中 的 一 种 : (a) 
多，(b) e 和 (c)a(ae1)。 图 9-4 所 示 的 三 个 包含 两 个 状态 的 自动 机 接受 这 三 种 形式 的 语言 ， 满 
足 定理 的 条 件 。 

归纳 步骤 : a 必然 是 以 下 四 种 形式 中 的 一 种 : (a) B+y, (b) By, (c) B 或 (d) (D (BAY 
是 正则 表达 式 )。 在 (d) 中，a 和 8B 表示 同一 种 语言 ， 所 以 结论 显然 成 立 。 对 其 他 情况 , BMA 
M" 分 别 是 接受 B 和? 所 表示 语言 的 NDFA， 它 们 的 状态 集 不 相交 。 设 它们 的 初始 状态 分 别 是 s 和 
so”"， 它 们 的 终结 状态 分 别 是 s M so (a), (b), 、(e) 中 的 转换 图 如 图 9-5 所 示 。 

设 a、B 和 的 长 度 分 别 为 | al 、1 81 Ml yl, n, A n" 2 RE M, MA M" 中 的 状态 
数 。 在 (a) 中 ,1l al =| Bl +l yl +1, Hn=n' + n"+2, 根据 归纳 假设 , n'<21 Bl, n's 
21yl ， 所 以 有 ns21 al 。 并 且 , 在 (a) 中 加 入 的 仅 有 的 边 是 从 % 出 发 的 两 条 边 ， 满 足 从 每 个 
顶点 至 多 引出 两 条 边 的 限制 ， 且 从 s 和光 各 有 一 条 边 引 出 。 根 据 假 设 ， 之 前 没有 从 sA s” hE 
的 边 ， 则 从 s,URI "出 发 的 边 数 满足 边 的 限制 。 最 后 ， 显 然 没 有 从 st 出 发 的 边 。 同 理 可 证 明 
(b) 0° 

Wc), Alal =1 Bl +1, n=n'+2, 因为 n'<21 Bl , 所 以 n<21 al , 很 容易 验证 
从 每 个 顶点 出 发 的 边 不 超过 两 条 的 约束 。 


图 9-4 长 为 1 的 正则 表达 式 对 应 的 NDFA M 的 状态 转换 图 





c B* 


图 9-5 ”接受 较 长 正则 表达 式 表示 的 语言 的 NDFA M 的 状态 转换 图 





OQ 一 个 正则 表达 式 a 的 长 度 是 串 a 所 包含 的 符号 个 数 。 例 如 ，1! et) =2。 当 计算 “的 长 度 时 ， 应 忽略 括号 [ 如 
正则 表达 式 (a" 8" ) " 的 “长 度 " 是 5 而 不 是 7]。 

O ”事实 上 ， 从 3 到 "的 边 并 不 是 必要 的 。 我 们 能 够 识别 st' 和 so”。 类 似 地 ， 在 图 9-5a 中 ， 也 能 够 识别 s H s”, 
并 把 它们 作为 终结 状态 。 
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例 9.4 下面 为 长 度 为 5 的 正则 表达 式 ab” +e 构造 一 个 NDFA。a、8 Alc 的 NDFA 如 图 9- 
4c 所 示 。 用 图 9-5c 所 示 的 构造 方式 构造 六 的 自动 机 如 图 9-6a 所 示 。 用 图 9-5b 所 示 的 构造 方式 
构造 ob “的 自动 机 如 图 9-6b 所 示 。 最 后 ， 用 图 9-5a 所 示 的 构造 方式 构造 ab" +c 的 NDFA。 这 个 
自动 机 有 10 个 状态 ， 如 图 9-6c 所 示 。 口 





图 96 žab’ +c 构造 NDFA 的 过 程 


还 有 另 一 个 结果 值得 一 提 。 给 定 任何 NDFA， 能够 找到 一 个 等 价 的 “确定 型 "有 穷 自动 机 
DFA。 然 而 ， 对 于 给 定 的 个 状态 的 NDFA， 等 价 的 确定 型 有 穷 自 动机 的 状态 数 有 2" 个 ， 因 此， 
转换 到 确定 型 有 穷 自 动机 并 不 总 是 模拟 非 确定 型 有 穷 自 动机 的 有 效 方法 。 然 而 ,确定 有 穷 自 动 
机 在 模式 识别 方面 是 非常 有 用 的 。 首 先 回顾 一 下 相关 的 定义 。 

定义 确定 型 有 穷 自动 机 (DFA) 是 一 个 满足 以 下 条 件 的 非 确定 型 有 穷 自动 机 (S，I，5，s， 
F): 

1) 对 于 所 有 的 seS，c(*，e) = 

2) 对 于 所 有 的 seS 和 aeT， là(s, a) | <1, 

定理 9.3 ”如果 了 是 一 个 正则 集 ， 则 存在 一 个 DFA 接受 工 。 

证 明 : 由 定理 9.2 知 ， 存 在 一 个 NDFA M = (S, 1, 8, s, 1s, BBL, REM 转换 成 
DFA 即 可 。 首 先 ， 需 要 找到 状态 对 (*，#) ， 使 得 (*，e) 凡 (:，e ) 。 为 此 ， 先 构造 一 个 有 向 图 G 
-(S, E), BPA (s, 0, QGSBDOR 8C, e)&& 0, PURIEÉG (5, E), CECHA 
反 传递 闭 包 。 可 以 看 出 ， 当 且 仅 当 (s, EM, (s, ÑG, e). 

现在 按照 如 下 方式 构造 NDFA M' =(S', I, 8’, s, F), 满足 L(M') =L(M) BMA e 
转换 ; 

1)S'= is] Ultl ls, a) t, seS, acl} 

2) 对 于 每 个 seS' 和 ael, 6'(s, a) = lul (s, t) eE' 有 日 6(1，a) 包 含山 

3)F'zisi (s, Nek’ AfeF} 

HERA L(M') =L(M) 的 过 程 留 给 读者 作为 练习 。 这 里 M' 没 有 e 转换 。 

下 面 ， 从 M' 构 造 一 个 DFA MW"， 它 的 状态 集 是 SER, MM = (CCS), I, 8, tsh, 
F"), H: 

1) 对 3 的 每 个 子 集 S 以 及 ae1， KFS, a) ={tl HHA se, 8'(s, A08 1| 

2)F'z|SI Sn Fsój 

通过 对 1 w1 进行 归纳 可 以 证 明 当 且 仅 当 S= {tl S, w) (te, e)l, Gsl, w) BCS, 
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e ) ， 证 明 过 程 作为 练习 留 给 读者 自行 完成 。 因 此 ,可 得 L(M) =L(M') =L(M"), 口 

例 9.5 考虑 图 9-7 的 NDFA M, MERE s 能够 沿 着 标记 e 的 路 径 到 达 状 态 ;, 和 终结 状态 
54， 这 样 ， 在 证 明定 理 9.3 时 提 到 的 计算 有 向 图 G 的 自 反 传 递 闭 包 C' 时， 必须 增加 边 (s ，s)。 
完整 的 G' 如 图 9-8 所 示 。 从 M 和 C 可 构造 NDFA M'， 如 图 9-9 所 示 。 因 为 C0' 的 每 个 顶点 都 有 一 
条 边 进 入 s, MUE M' 中 的 所 有 状态 都 作为 终结 状态 。 既 然 在 M 中 只 有 进入 ,的 边 标 记 为 e ， 
因此 s RERE MH, 





CT v) 
图 9-7 49.5 BY NDFAM 图 9-8 BAG’ 


在 从 1f' 构 造 DFAM HME, MIT 8 个 状态 。 然 而 ， 只 有 4 个 状态 是 从 初始 状态 可 达 的 ， 
因此 ， 其 他 4 个 状态 可 以 删除 。 最 后 得 到 的 DFAM "如 图 9-10 所 示 。 口 





图 9-9 NDFA M' 图 9-10 DFA M" 


9.2 正则 表达 式 的 模式 识别 


考虑 一 个 模式 识别 问题 : 给 定 文 本 串 x = aa,…a, 和 称 为 模式 的 正则 表达 式 w。 我 们 希望 找 
到 最 小 的 j， 对 于 j， 存 在 某 个 i， 使 得 % 的 子 串 a,a;,,…a; 属 于 a 表示 的 语言 。 

这 类 问题 在 文本 编辑 程序 中 普遍 存在 。 许 多 文本 编辑 程序 允许 用 户 在 文本 中 进行 替换 操作 。 
例如 ， 用 户 可 以 指出 准备 用 某 个 单词 代替 一 段 文 本 zx 中 的 单词 y。 为 了 处 理 这 个 命令 ， 文 本 编辑 
程序 必须 能 够 定位 作为 x 的 子 串 的 y 在 * 中 出 现 的 位 置 。 一 些 复杂 的 文本 编辑 器 允许 用 户 给 出 一 
个 正则 集 作 为 要 替换 的 可 能 串 集合 。 例 如 ， 一 个 用 户 可 能 说 :“ 用 空 串 替 代 * 中 的 [1" ]”， 这 意 
味 着 从 x 中 删除 括号 [ ] 以 及 位 于 括号 中 的 符号 。 

上 面 问题 的 形式 化 陈述 就 是 用 表达 式 B = a 替换 给 定 的 正则 表达 式 a, RPI BRAS 
母 表 。 通 过 在 B 表示 的 语言 中 寻找 x 的 最 短 前 级 ， 可 得 到 a 在 x = cia…a, 中 的 第 一 次 出 现 的 位 置 。 
为 了 解决 这 个 问题 ， 首 先 构造 一 个 NDFAM 来 识别 B 表示 的 集合 ， 然 后 应 用 (下 面 的 ) 算 法 9.1， 确 
定 状 态 5, 的 集合 序列 。S, 是 NDFA ERA aa…ai(i =1，2，…，m) 字 符 串 之 后 所 的 状态 集合 。 只 
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要 $ 包 含 一 个 终结 状态 ， 我 们 就 知道 cia…aw 有 一 个 后 缀 aici,…w， 使 得 0,0,,,---0,7E a 表示 的 语 
言 中 (其 中 ，1 <i<j)。 习 题 9.6 ~9.8 讨论 了 如 何在 字符 串 中 找到 区 模式 的 最 左 端 ) 的 技术 。 

正如 定理 9.3 所 述 ， 可 以 通过 将 NDFA 转换 成 确定 型 有 穷 自动 机 ， 从 而 模拟 NDFAM 对 于 文 
AH x 的 行为 。 然 而 ， 这 种 方法 的 代价 很 大 ， 因 为 需要 从 正则 表达 式 8 得 到 包含 21 Bi 个 状态 
的 NDFA， 而 后 再 将 NDFA 转 成 DFA， 而 这 个 DFA 的 状态 数 将 近 27 A 个 。 构 造 这 样 一 个 DFA 的 
工作 量 可 令 人 望 而 生 共 。 

另 一 个 模拟 NDFA M 对 输入 串 x 的 行为 的 方法 是 : 首先 消除 M 中 的 e 转换 ， 再 用 定理 9.3 
中 的 方法 ， 构 造 一 个 没有 e 转换 的 NDFA M'。 然 后 ， 通 过 对 每 个 i 计算 M' 在 读 和 人 ciaz…a; 之 后 可 
能 的 状态 集 S,(1<i<n)， 模拟 NDFA M' 对 输入 串 x = wa …a, 的 行为 。 事 实 上 ， 每 个 S; 是 定理 
9.3 中 的 DFAM" 在 读 人 oa…a, 之 后 所 处 的 状态 。 

利用 这 种 技术 ， 不 需要 构造 M”"， 只 需 计 算 M' 在 处 理 串 x 过程 中 出 现 的 杂 的 状态 。 为 了 解释 
怎样 计算 集合 5,， 必 须 先 说 明 怎样 从 Sut So FRAR 

S, =U ó'(s,a,) 
这 里 5' 是 M' 的 状态 转换 函数 。5S, 是 最 多 21 BI 个 集合 的 并 ， 每 个 集合 至 多 包含 21 Bl 个 成 员 。 
因为 在 进行 集合 并 运算 时 必须 消除 重复 成 员 ( 否则， 集合 的 表示 可 能 会 变 得 元 余 ) ， 所 以 对 于 每 
个 输入 符号 ，M' 显 然 需要 做 0( BI’ ) 步 模拟 操作 ， 或 者 说 整个 模拟 需要 O(n! Bl?) 

令 人 奇怪 的 是 ， 在 许多 实际 情况 下 不 用 消除 es 转换， 直接 根据 定理 9.2 从 正则 表达 式 B 直接 
构造 NDFAM， 其 效率 反而 会 高 。 由 定理 9.2 给 出 的 关键 属性 是 : 在 转换 图 中 ， 从 1 的 每 个 状态 
最 多 引出 两 条 边 。 这 个 属性 使 我 们 能 够 证 明 ( 下 面 的 ) 算 法 9. 1 需要 O(n! Bl ) 步 来 模拟 B 在 字 
FER x =a,a,--a, 上 构造 NDFA 的 过 程 。 

算法 9. 1 模拟 一 个 非 确 定型 有 穷 自动 机 。 

输入 : 一 个 NDFAM-(S, 1, 8, s, 了) 和 1 中 的 字符 申 %x=aja,…a,o 

给 出 : 状态 序列 5, ,5,，5S,，…，5S,， 它 满足 


S, = {sl (s),a,a,°--a;) (s,€) | O<icn 


1， for /<— 0 until n do 
begin 


if i= 0 then S; — {se} 
else $, e U (s, à); 
sE5S,, 


comment S: 尚未 达到 最 终 值 , 现在 的 值 相 应 于 上 面 提 到 的 集合 T, 


的 对 应 值 ; 
4 标记 Si 中 的 每 个 /为 “considered”; 
5. 标记 S — $, 中 的 每 个 /为 “unconsidered”; 
| 6. QUEUE < 5, 
7. while QUEUE 非 空 do 


wn 


begin 
找到 QUEUE 的 第 一 个 元 素 : 并 从 QUEUE 中 删除 ; 


8. 

: 9, for 5(t, e) 中 的 每 个 do 
| 10. if u is "unconsidered" then 
| begin 

11. 标记 & "considered"; 
:12. 将 u 加 到 QUEUE 和 Ss, 上 
; end 

end 





| ond 
图 9-11 模拟 一 个 非 确 定型 有 穷 自动 机 的 算法 
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方法 : 为 了 从 5,., 计 算 5,， 首 先 找到 状态 集 T, = {tl XH seS, te8(s, a) 1, RAH, 
的 “ 闲 包 ”， 可 以 通过 对 了 中 的 1:, 求 所 有 的 状态 we6(1，e ) ， 并 将 之 加 到 也 中 来 实现 闭 包 计算 。 
算法 中 7. 的 闭 包 是 5,， 可 通过 将 7. 中 还 没有 计算 过 56(1:，e ) 的 状态 :组织 成 一 个 队列 来 计算 。 算 
法 如 图 9-11 所 示 。 口 

例 9.6 设计 为 图 9-6c 表示 的 NDFA。 假 设 输入 是 x =ab， 那 么 在 第 2 行 上 ，5。 = (sls Æ 
第 9~12 行 上 , s, f s, 0 s, RME QUEUE 和 5。。 考 虑 s, 和 ss 则 不 会 添加 任何 东西 ， 因 此 ，5,。 = 
1s,，s,，ss1。 在 第 3 行 ，S, = {1s,} ， 考 虑 s, 导 致 ;添加 到 5, 上，s 又 引起 s, 和 s, 添 加 到 S, E, w 
ss 什么 也 不 添加 ，s, 使 so 添加 到 Sb, Alb, S = is, ss 55, 5, Sol, TERIS 行 上 ，5, 被 设置 
Bil se} 。s6 使 ss 和 5 添加 到 5S, 中 ， 而 s) 导 致 sw 添加 到 5,， 因 此 ,5, = is, ss, 57, silo 口 

定理 9.4 算法 9.1 正 确 地 计算 状态 序列 S,，S,，…，S,， 其 中 Sm {s1 (s, aata) E 
(s, e)}o 

证 明 ; 算法 9.1 的 正确 性 证 明 是 一 个 简单 的 归纳 证 明 ， 留 给 读者 作为 练习 。 口 

定理 9.5 假设 自动 机 及 的 转换 图 上 从 每 个 顶点 引出 的 边 不 超过 e 条， 且 及 有 mm 个 状态 ， 
则 算法 9.1 对 于 长 度 为 的 输入 串 需 要 进行 O(emm) 步 计算 。 

证 明 : 考虑 某 个 特定 i 值 的 5, 的 计算 ， 图 9-11 的 第 8 ~ 12 行 需要 执行 0(e) 步 。 因 为 对 于 给 
定 的 ;， 没 有 状态 会 被 放 到 QUEUE 上 两 次 ， 所 以 7 ~ 12 行 的 循环 需要 执行 0(em) HH, ABB 
出 ， 主 循环 体 ( 行 2 ~ 12) 执 行 需要 的 时 间 为 0(em) 。 因 此 ， 整 个 算法 需要 执行 0(emn) 步 。 

下 面 是 一 个 重要 的 推论 ， 该 推论 将 正则 集 的 识别 与 算法 9. 1 相关 联 。 

Hit WRG 是 正则 表达 式 ，x = aa …a, 是 长 度 为 = 的 字符 串 ， 那 么 有 一 个 接受 B 表示 的 
语言 NDFA M， 使 得 算法 9. 1 需要 0(n1 81) 步 确定 状态 序列 S, S,, +, S,, 这 里 5; = dsl (so, 
a,a,"a,) E (s, €)}, O<i<n, 

证 明 : 通过 定理 9.2， 可 以 构造 NDFAM，M 最 多 有 21 Bl 个 状态 ， 每 个 状态 最 多 引出 2 条 
边 ， 这 样 定理 9.5 的 e 最 多 为 2， 根 据 定理 9.5， 结 论 显然 成 立 。 口 

各 种 模式 识别 算法 可 以 从 算法 9. 1 构造。 例如， 假设 给 定 正 则 表达 式 a MLER x = ala… 
an, RNA BRA) Wk, Aj<k, aa, ca TE o 表示 的 集合 中 。 应 用 定理 9. 2， 我 们 能 够 
从 a 构造 一 个 NDFA M 来 接受 语言 六 wx。 为 了 找到 最 小 的 上 ， 使 得 oa a, TE LM) P, RNA 
在 图 9-11 中 的 算法 的 第 2 ~ 12 行 的 语 名 块 结束 处 播 人 一 个 测试 语句 ， 用 于 检测 SBA FH 
的 一 个 状态 。 根 据 定理 9.2， 我 们 可 以 将 下 取 为 一 个 单元 素 集合 ， 所 以 这 个 测试 不 需要 花 很 多 时 
间 ， 时 间 复 杂 度 为 O(m), ， 其 中 m 是 M 的 状态 数 。 如 果 5, 包 含 正中 的 一 个 状态 ， 找 到 L(M) 中 x 
的 最 短 前 级 a,.a,…a;， 算 法 就 可 以 立即 跳出 主 循环 。 

可 以 进一步 修改 算法 9. 1 从 而 为 每 个 上 产生 最 大 的 (或 者 最 小 的 门 j «k, f aan a TE a 
示 的 集合 中 ， 这 可 以 通过 将 集合 5, 中 的 每 个 状态 与 一 个 整数 相关 联 予 以 实现 。 和 5; 中 的 状态 s 关 
联 的 整数 表示 最 大 (或 最 小 ) 的 j， 使 得 (s。, aaea) ECs, ©) 。 将 算法 9. 1 中 这 些 整 数 更 新 的 
具体 细节 留 给 读者 自行 完成 。 


9.3 子 串 识别 


上 节 所 述 一 般 问 题 中 的 一 个 重要 特例 是 ， 当 正则 表达 式 a 可 以 表示 成 形式 y ty +… ny BR, 
其 中 每 个 % 是 某 个 字母 表 了 上 的 字符 串 。 定 理 9.5 的 推论 意味 着 能 在 文本 串 x = aa …a, 中 用 Oln) 
步 找到 模式 7 的 第 一 次 出 现 ， 这 里 1! 是 所 有 % 的 长 度 总 和 。 然 而 ， 还 可 以 找到 一 个 需要 0(1+n) 步 
的 解决 方案 。 先 考虑 只 有 一 个 模式 串 y = 6.8,…b, 的 情况 ， 这 里 的 每 个 b 均 是 了 中 的 符号 。 
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从 模式 y 构造 一 个 确定 型 模式 匹配 机 器 M,, MRA D y 中 的 最 短 实 例 串 。 为 了 构造 
M,, ， 首 先 构 造 一 个 框架 (skeletal) DFA， 这 个 DFA 包含 1+1 个 状态 ,分 别 标记 为 0,。1，…, 1, H 
在 输入 字符 b. 作 用 下 将 从 状态 i~1 转 到 状态 i， 如 图 9-12 HR. HERRA bb, RAO 均 
转 到 它 自身 。 可 以 把 状态 ;看 成 一 个 指针 ， 指 向 模式 串 y 中 的 第 i 个 位 置 。 


"e (ee) (DO e Pew O) 


图 9-12 一 个 框架 机 器 


模式 匹配 机 器 M, 的 操作 类 似 确定 型 有 穷 自 动机 ， 不 同 之 处 仅 在 于 它 在 扫描 同样 的 输入 字符 
时 能 够 进行 多 种 状态 转换 。MM ,的 状态 集 和 框架 DFA 一 样 ， 这 样 W ,的 状态 7 对 应 于 模式 串 y 的 前 
58 b bibo 

MM, 从 状态 0 开始， 旦 输入 指针 指向 a, ，o, 是 文本 串 x = aa…a。 的 第 一 个 字符 。 如 果 a, =b, 
则 ML 进入 状态 1， 并 且 将 它 的 输入 指针 前 移 到 文本 串 的 位 置 2。 如 果 a, b, M M, 仍 旧 在 状态 
0， 并 且 将 它 的 输入 指针 前 移 到 位 置 2。 

假设 读 人 字符 a1a,…a 后 ，M, 在 状态 j， 这 意味 着 a1a,…a 的 最 后 j 个 字符 是 5.8,…b,， 且 对 
T m»j, aay a I kJ m 个 字符 不 是 5.b,…b, 的 前 级 。 如 果 下 一 个 输入 字符 a,,, 和 5,, 一 致 ， 
M, 进 入 状态 j+1， 且 输入 指针 前 移 到 a,,,; 如 果 ai,1 关 b ,1，M 及 ,进入 编号 最 高 的 状态 i，b,b,…b, 
Eaa aa ,的 一 个 后 缀 。 

为 了 帮助 确定 状态 i， 机 器 1 ,用 一 个 整数 值 函数 上 和 状态 关联 ， 称 为 失败 函数 (failure func- 
tion) ,使 得 f()) 是 小 于 j 的 最 大 的 ;，( 5618,…b, 是 b.6,…b 的 一 个 后 缀 ) ， 即 .A) 是 最 大 的 * <j， 使 
得 5.5,…b, - b, .1b,,,2…b;。 如 果 没 有 这 样 的 s 宇 1， 则 f(j) =0。 

例 9.7 假设 y=aabbaab, f 的 值 如 下 : 

i 1 213.4151|67 
f00190|1/[0[|0|/1/2,3 
例如 ， 因 为 在 aabbaa 的 所 有 前 缀 中 ， 能 够 作为 aabbaa 后 缀 的 最 长 的 适当 前 级 是 aa, WMA 
f(6) 22, 口 

接 下 来 给 出 一 个 算法 来 计算 失败 函数 。 首 先 ， 为 了 说 明 M ,怎样 使 用 失败 函数 ， 定 义 函 数 
f? AMF: 

1) f? G) = fG) 

2) PG) = fü" QD, 对 于 m>1 

即 4"()) 只 是 将 f 运 用 到 7 上 m 次 。[ 在 例 9.7 rn, /? (6) =1。] 

假设 M, 读 人 字符 申 aaa ERARAJ, Ea, ,1。 此 时 ，M, 重 复 地 应 用 失败 函数 到 j 
上 ， 直 到 找到 m 的 最 小 值 ， 使 得 

1)f? G) -uHa,, zb, 

2)f7 (j) =0 H a,,, xb, 

即 M, 通 过 状态 .A G), OO, ，… 回 退 直 到 情况 1 或 情况 2 对 Am (G) fr, BEH () 
不 成 立 为 止 。 如 果 情 况 1 成 立 ， 则 MAARE u+, WRR 2 成 立 ， 则 1, 进 入 状态 0。 在任 
一 种 情况 下 ， 输 入 指针 都 移动 到 位 置 a,,,。 

在 情况 1 中 ， 很 容易 验证 ， 如 果 bbb y 中 能 作 oo …w 后 级 的 最 长 前 级 ， 则 05, 
b. FEY 中 能 作为 a1a,…a,,! 后 缀 的 最 长 前 级 。 在 第 2 种 情况 下 ，y 没有 前 缀 是 aan, B 
EA 
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接 下 来 ，M, 处 理 输 入 符号 a,,,。M, 用 这 种 方式 继续 操作 ， 直 到 获得 以 下 两 种 结果 之 一 为 止 。 
一 种 是 M, 进 入 终结 状态 !， 此 时 被 扫描 到 的 最 后 ! 个 输入 符号 构成 模式 y= 6,5,…b, 的 一 个 实例 ; 
另 一 种 结果 是 直到 M, 处 理 了 x 的 最 后 一 个 输入 符号 ， 也 没 能 进入 状态 !， 此 时 我 们 知道 y 不 是 x 
的 子 串 。 

例 9.8 设 y=aabbaab。 一 个 模式 匹配 机 M, 如 图 9-13 所 示 ， 虚 线 箭头 指向 失败 函数 在 每 个 
状态 下 的 值 。 在 输入 x = abaabaabbaab 时 ，M, 将 执行 如 下 的 状态 转换 序列 ; 

BMA: a baabaabbaab 

状态 :0 10123123 4567 

0 0 

例如 ， 初 始 的 M, 处 在 状态 0， 在 读 和 人 x 的 第 1 个 符号 后 ，M, 进 入 状态 1。 因 为 在 状态 1 下 输入 第 
2 个 符号 5 没有 相应 的 状态 转换 ， 所 以 M, 进 入 状态 0， 即 是 状态 1 下 的 失败 函数 的 值 ， 且 不 移动 
输入 指针 。 因 为 y 的 第 一 个 符号 不 是 b， 属 于 情况 2， 则 MM ,仍旧 在 状态 0， 继续 移动 它 的 输入 指 
针 到 位 置 3。 

在 读 入 第 12 个 符号 时 ，M, 进 入 终结 状态 7。 这 样 ， 在 x 的 第 12 个 位 置 上 ，M, 找 到 了 模式 y 
的 一 次 出 现 。 口 





9-13 一 个 模式 匹配 机 器 


函数 能够 以 和 M ,操作 非常 类 似 的 方式 进行 迁 代 计算 。 根 据 定义 , AR1) 20, 假设 已 经 计算 
TAO), A2), =, f, BBG) =i。 TM +1), 可 检查 5b, 和 6;,1。 如 果 b, =5,,,, 
WE bb, bib. =biwbnso2…bbjww， 因 此 fj+1) Sf) +1; WE b b RORI 
m, 44 

1. f" (j) =u, Hb, -b,u 

2. f? G) =0 H. Bi 41 #b, 

在 第 1 种 情况 下 , Sf 41) =u4+1; 对 于 第 二 种 情况 , 令 .FJ 1) =0。 下 面 算法 给 出 相关 
的 细节 。 

算法 9.2 计算 失败 函数 。 

输入 ; 模式 y=6.b,…b,, 121, 

输出 : y KEAR So 

方法 : 执行 如 图 9-14 所 示 的 程序 。 口 

例 9.9 考虑 算法 9. 2 在 输入 y = aabbaab 时 的 行为 。 开 始 时 及 1) =0， 因 为 65, =5,, BY, 
用 2) =1。 Ri, b, 75b, b,#b,, PU f(3) =0。 继续 这 种 方式 ， 可 以 得 到 例 9.7 中 给 出 的 的 
函数 值 。 口 

现在 证 明 算法 9.2 EOC I yl ) 时 间 内 正确 计算 函数 /。 首 先 证 明 算 法 9.2 的 正确 性 。 

定理 9.6 算法 9.2 计算 失败 函数 f。 

证 明 : 通过 在 /上 应 用 数学 归纳 法 来 证 明定 理 ， 若 f(j) 是 小 于 j 的 最 大 整数 ;， 使 得 5,5,… b, 
zb, ab; urbi, 如 果 没 有 这 样 的 i 存在 ， ws) =0, 

根据 定义 ，K1) =0。 假 设 对 所 有 的 A(k)(k <j) ， 归 纳 假设 为 真 。 在 计算 f(j) 时 ， 算法 9.2 
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在 第 4 行 比较 bu DM 

情况 1 假设 =b 1 11。 由 于 f(j ~1) 是 最 大 的 i 使 得 5.… b mb ob a, WASO) =i+ 
1。 这 样 ， 根 据 算法 第 5 行 和 第 6 行 ， 算法 正确 地 计算 了 f()) 。 

情况 2 假设 zzb,,,,， 那 么 必须 找到 满足 6.… b; mb; seb; A b =5, 的 i 最 大 的 值 (如 
果 i 存 在 的 话 ) ; 如 果 不 存在 这 样 的 i， 则 很 明显 /(j) =0， 而 算法 在 第 5 行 中 已 正确 计算 了 7) 。 
假设 记 ， 纪 ，… 分 别 是 使 下 式 成 立 的 i 值 的 最 大 者 ， 次 大 者 ，…… 


f(D) 0; 
for j — 2 until } do 
begin 


i€ fü — 1 
while b, * bin andi > 0 do i + f(i); 
if b, = b,,, and i= 0 then fG) — 0 
else fU) it 1 

end 





图 9-14 ”失败 函数 的 计算 
bib, bimbi seb), 

Bug EIHABE,Hu-fü-).b5-fü)-2f"^G-D, uf )-2f"G-D, AA 
i, EB k - 1 XB i ATA, E boob Sb sob, Bi NT d WA CB, TE b e b = 
b, iab, zb seb. 算法 第 4 行 依次 计算 比较 i，i,，…， 直 到 找到 i 值 (如 果 存 在 这 样 的 
i), ME 61… b =b seb LB 5, bA. Æ while 语句 执行 终止 的 时 候 ， 如 果 有 存在 这 样 一 个 
i,, Witi,, Bik, BASS 行 语句 正确 计算 了 /f())。 

这 样 ， 对 所 有 的 ]， 算 法 都 正确 地 计算 f(j) ， 定 理 得 以 证 明 。 Li 

定理 9.7 算法 9.2 可 以 在 O(1) 步 内 正确 计算 失败 函数 所 

证 明 : 算法 的 第 3 行 和 第 5 行 的 代价 是 固定 的 ，while 语句 的 代价 是 和 第 4 行 上 do 语句 后 的 语 
Ai icf i) POE ABR CABS. SE i 值 的 唯一 方法 是 在 第 6 FRR SU) =i+1， 然 后 在 第 2 
行 给 7 加 1, 在 第 3 行 设置 i 值 为 1(j -1)。 既 然 ; 的 初始 值 为 0， 那 么 第 6 行 至 多 执行 1-1 次 。 于 是 
得 出 结论 : 第 4 行 的 while 语句 的 执行 次 数 不 可 能 多 于 ! 次 。 这 样 ， 执 行 第 4 行 的 总 代价 是 OC). 
算法 的 余下 部 分 的 代价 显然 是 0(1) ， 这 样 ， 算 法 总 的 执行 时 间 代 价 为 0(1) 。 口 

与 定理 9.6 一 样 ， 我 们 能 够 证 明 当 且 仅 当 bbb EEA a.a,…a 的 后 缀 的 y 的 最 长 前 级 时 ， 
模式 匹配 机 M, ERA aa, Ja EACUS i。 这 样 ，M, 就 能 够 正确 地 在 文本 串 x = wa…a, 的 最 
左边 找到 y 的 出 现 。 

根据 定理 9.7 可 以 证 明 ，M, 在 处 理 输 入 串 * 时， 将 经 过 至 多 2 1x1 次 状态 转换 。 这 样 ， 我 们 
能 够 通过 跟踪 M, 在 输入 x 上 的 状态 转换 确定 y 是 否 是 x 的 一 个 子 串 ? 。 为 此 ， 只 需要 y HRM 
数 f 就 可 以 进行 判断 。 由 定理 9.7 可 知 ， 能 够 在 0(1y1) 时间 内 构造 沙 数 /， 这 样 能 够 在 
0( lx! +lyl ) 时 间 内 确定 y 是 否 % 的 子 串 ， 这 个 时 间 与 字母 表 的 规模 无 关 。 如 果 模 式 串 的 字母 
表 比 较 小 ， 且 文本 串 又 比 模式 串 长 得 多 ， 那 么 可 以 考虑 模拟 DFA 接受 语言 1'y 的 过 程 来 判断 y 
是 否 是 x 的 子 串 。 该 DFA 对 于 输入 的 每 个 字符 恰好 做 一 次 状态 转换 。 

算法 9. 3 为 1*y 构 造 一 个 DFA。 


O BHB—TF, XX E, M, 的 状态 由 指向 模式 y 中 的 位 置 指针 反映 出 来 。 因 此 ，M, 的 状态 转换 能 够 通过 在 y AB 
动 指针 直接 实现 。 
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输入 : HER] EAR y 2b bbs ASHER, BO, ERU. LI EWE 
字符 都 不 相同 的 字符 。 
Wr. 一 个 DFA M, 满足 L(M) zl'y, 
方法 : 
l. 用 算法 9.2 为 y 构造 失败 函数 f。 
2. 设 M=(S$， I, 6, 0， 中),S=10，1,…, 证 ,构造 6 的 过 程 如 下 : 
begin 
for j = 1 until / do 6G — 1, 5) —— j; 
for each b in 1, b = b, do &(0, b) — 0; 
for j = 1 until / do 


for each b in 1, b ¥ b,,, do 650, b) — &(fCj), b) 
end 口 


定理 9.8 算法 9.3 构造 一 个 DFA M, BE 
(0, aapea) É G, €) 
3 BH b b, b 2a,0,*a, FK — ^^ Ja HR, 县 不 存在 i>j 时 ， 6b16b,…b, 是 2,0, a, 8) — 4 
kz Ro 
证 明 : 利用 定理 9.6 中 的 论证 方法 ， 对 上 进行 归纳 。 具 体 证 明 过 程 留 给 读者 自行 完成 。 口 
例 9-10 使 用 算法 9.3 得 出 的 识别 模式 y = aabbaab 的 DFA M 如 图 9-15 所 示 。 





图 9-15 ”一 个 接受 (e+b) " aabbaab 的 确定 型 有 穷 自动 机 


在 输入 x = abaabaabbaab Ht, M 将 经 历 以 下 的 状态 转换 : 

输入 : a b a a b a a b b a a b 

状态 :0 1 0 3 2 3 1 2 3 4 5 6 7 

M 和 1, 之 间 唯 一 的 区 别 是 M 在 字符 不 匹配 模式 串 的 情况 下 提前 计算 了 M 的 下 一 个 状态 。 这 
FÉ, M 在 每 个 输入 符号 上 恰好 做 一 个 状态 转换 。 

总 结 本 节 的 主要 结论 可 得 出 下 面 的 定理 。 

定理 9.9 在 0O(1xl +1yl) 时 间 内 能 够 确定 y 是 否 是 xx 的 子 串 。 

现在 考虑 给 定 若干 个 模式 串 y, ，y, ，…，7 时 ， 确 定 某 个 y. 是 否 给 定 字 符 串 x = aia…a, 的 子 
串 。 本 节 介 绍 的 方法 也 适用 于 解决 这 个 问题 。 首 先 为 y, ，y, ，…，y; 构 造 一 个 框架 机 器 ， 这 个 框 
架 机 器 将 是 一 棵 树 。 接 着 在 与 1= Ly, 1 + yl eee d y! 值 成 比例 的 时 间 内 计算 关于 这 棵 树 
的 失败 函数 。 然 后 可 以 用 前 面 所 介绍 的 方式 构造 模式 匹配 机 。 这 样 ， 在 0(! +n) FA, MHS 
定 某 个 y, 是 否 为 x 的 子 串 ， 具 体 细 节 贸 作 练 习 请 读者 自行 完成 。 


9.4 双向 确定 型 下 推 自动 机 
一 旦 有 人 猜测 有 0( 1 x1 + 1 y1 ) 的 算法 可 用 于 确定 y 是 否 为 x 的 子 串 ， 那 么 这 样 的 算法 就 
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不 难 找到 了 。 然 而 是 什么 原因 会 让 人 们 猜想 有 这 样 的 算法 存在 呢 ? 这 种 猜想 可 能 缘 自 对 双向 确 
定型 下 推 自动 机 (two-way deterministic pushdown automata， 简 称 2DPDA) 的 研究 。 

2DPDA 是 一 种 用 于 接受 语言 的 特殊 的 图 灵机 。 我 们 可 以 根据 语言 识别 问题 来 重新 形式 化 许 
SRA A. I, WRAL RMB acyl x 和 7Y 均 在 六 中 ,ee7， 且 y 是 x OTB], 3 
么 确定 y 是 否 是 x 的 子 串 等 价 于 确定 字符 串 xcy 是 否 语言 中 的 语句 。 本 节 将 说 明 存 在 一 个 能 够 
Sl LY) 2DPDA, RB 2DPDA 识别 这 个 语言 可 能 需要 O(n’ Ml, 但 是 有 一 种 功能 强大 的 模拟 
技术 ， 采 用 这 种 技术 ， 一 个 RAM 能 够 在 0(n) 时 间 内 模拟 给 定 的 2DPDA 在 长 度 为 n RARE 
的 行为 。 本 节 将 详细 研究 这 种 模拟 技术 。 

可 以 将 一 个 2DPDA 看 作 一 个 双 带 图 灵机 ， 在 这 个 图 灵机 上 ， 一 个 磁带 用 作 下 推 存 储 器 ， 如 
9-16 所 示 。2DPDA 有 一 个 只 读 输 入 带 ， 其 最 左边 格子 上 有 一 个 左 终 端 标 记 符 * ， 最 右 端 格子 
上 有 一 个 右 终端 标记 符 $ ， 两 个 终端 标记 符 之 间 的 是 要 识别 的 输入 串 ， 每 个 符号 占 一 格 。 输 入 符 
号 来 自 输 入 字母 表 7， 假设 7 不 包含 和 $ 。 输 入 磁头 一 次 读 一 个 符号 ， 在 一 次 移动 中 输 人 磁头 
可 以 向 左 移动 一 格 、 保 持 静 止 或 者 向 右 移 动 一 格 。 假 设 磁头 不 可 能 移 到 输入 磁带 两 端的 终端 标 
记 符 之 外 ; 由 于 存在 ¢ 和 $ 标 记 符 ， 我 们 可 以 写 一 个 移动 函数 (next-move) ， 这 个 函数 从 来 不 会 
M. e 向 左 ， 或 从 $ 向 右 移动 输入 磁头 。 





图 9-16 双向 确定 型 下 推 自动 机 


下 推 列 表 ( pushdown list) 是 一 个 栈 ， 用 于 存放 来 自 下 推 列表 字母 表 了 中 的 字符 。 下 推 列表 的 
底部 单元 存放 特殊 字符 Z。 ， 该 字符 标记 栈 底 ， 假 设 Zo 不 在 了 7 中。 

有 限 控制 器 总 是 处 于 有 穷 状 态 集 5 的 某 个 状态 下 。 机 器 的 操作 由 移动 函数 3 确定 ， 对 于 S 中 
的 *、 集 合 TU {x ，$ | 中 的 a、TU {Zo1 中 的 4，5(s，a，4) 表 明 当 有 限 控制 器 处 在 状态 s 时 ， 
输入 磁头 正在 扫描 符号 a。， 下 推 列表 中 的 栈 顶 符号 为 4。 机 器 要 采取 的 动作 ， 有 三 种 : 


(s', d, push B) Ba BZZ, 
8(s, a, A) Lc d) 
(s', d, pop) 如 果 AZ, 
在 这 三 个 动作 中 ， 机 器 进入 状态 ,并 沿 d 方 向 移动 输入 磁头 (d = -1，+1 或 0 分 别 表示 向 左 


移动 一 格 ， 向 右 移动 一 格 或 保持 静止 ) push B 表示 将 符号 B 压 人 下 推 列表 的 顶端 ，pop 表示 从 
下 推 列表 中 移出 处 于 顶端 的 符号 。 
定义 ”可 以 形式 化 地 将 2DPDA 定义 为 7 元 组 : 
P = (S$,1,7,6,s0 Zo 58;) 
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ELE 
1)S 是 有 穷 控制 状态 的 集合 。 

2)7 是 给 入 字母 表 ( 不 包括 & MS). 

3) 了 是 下 推 列 表 字 母 表 (不 包括 Z。) 。 

4) 是 集合 (S- 1s] ) x QUl e, $})x(TUIZ}) KATH, 5(s, a, A) 的 值 如 果 
有 定义 ， 是 以 下 三 种 形式 中 的 一 种 : (85, d, push B), (s’, d)s', d, pop), Hs’ eS, B 
eTHde|-1,0, +1}. 假设 2DPDA 到 达 最 终 状态 后 不 再 移动 ， 某 些 状态 也 不 定义 移动 ， 
且 对 于 任意 的 * 和 4，65(s,x ，4) 的 第 二 个 元 素 d 不 是 -1, 8(*，$ ，4) 的 第 二 个 元 素 4 不 是 + 
1, BUA, 8(s, a, Z,) 没有 第 三 个 元 素 pop. 

5) 在 $ 中 的 % 是 有 限 控制 器 的 初始 状态 。 

6)Z, 是 下 推 列 表 的 底部 标记 。 

7)5: 是 指定 的 终结 状态 。 

一 个 2DPDAP 在 输入 w = aa;…a., 上 的 一 个 皮 时 描述 是 一 个 三 元 组 (*，i，a) ， 其 中 : 

1)s 是 5 中 的 一 个 状态 。 

2)i 是 整数 ， 表 示 输 入 磁头 的 位 置 (0<isn+1)。 通 常 假设 a6。= g, anaE 8. 

3)a 表示 下 推 列 表 中 的 字符 串 内 容 ，a 的 最 左 端 符号 在 栈 顶 。 

将 2DPDA 在 输入 a,a,…a, 下 的 一 次 移动 可 定义 成 D 的 二 元 关系 上 ， 即 

1) MH (s, a, A) =(s', d, push B), Wi(s, i, Ao) Hls’, itd, BAa), 

2) MR ls, a, A) 2 (s', d), WCs, i, Aa) h(s’, id, Aa). 

3) MI Sls, a, A) = s', d, pop), W(s, i, Aa) FGs', i+d, a). 

注意 ， 符 号 只 能 加 到 下 推 列表 的 顶端 ， 或 从 顶端 读 取 ， 或 从 顶端 移 走 。 我 们 还 要 限制 在 任 
何 时 候 2DPDA 的 下 推 列表 只 有 一 个 底部 标记 。 可 以 使 用 从 表示 0 个 或 多 个 移动 的 序列 ， 其 中 从 
是 上 的 自 反 传递 闭 包 。 

输入 w =a,a,…a,( 不 包括 底部 标记 ) , 2DPDA P 的 初始 加 是 (s。，1，2Z。)， 表 示 P 处 在 初始 
状态 s。 ， 输 入 磁头 正在 扫描 a,a,…a,a, ,最 左 端 的 符号 >， 且 下 推 列表 只 包含 底部 标记 Zo 

输入 z = aa …a, 的 接受 TD 的 一 种 形式 为 (s:，i，2Z。) (0<isn+1)， 表 示 P 已 经 进入 最 终 
状态 s;， 下 推 列表 只 包含 底部 标记 。 

如 果 2DPDA P ERMA wht, 对 于 0<i< | wl +1, EC, 1, 2) Cs, i, Za), WH 
2DPDA P REAR w。P 接受 的 所 有 字符 串 的 集合 记 作 L(P) ， 称 为 P 接受 的 语言 。 

下 面 考虑 一 些 2DPDA 和 它们 所 接受 的 语言 的 例子 。 这 里 不 采用 形式 化 的 7 元 组 ， 而 是 通过 
刻画 它们 的 行为 来 非 形式 化 地 描述 2DPDA。 

例 9.11 考虑 语言 L= {xcyl x 和 yy 在 {a, 外 “中 ,， 且 y 是 * 的 子 串 | 2DPDA P 能 够 按 如 下 
PRRI L, BR P HAR w 的 形式 为 xy， 其 中 x =a,0,--a,H ae la, b], 1<isn。 

1)P 向 右 移 动 输入 磁头 直到 过 到 c 为 止 。 

2)P 然后 向 左 移动 输入 磁头 ， 复制 a,a,.，…a, 到 下 推 列 表 ， 直 到 输入 磁头 到 达 左 侧 的 终端 标 
记 为 止 。 此 时 , P 的 下 推 询 表 中 有 xZ, = a10,…a,2。(x2Zo 的 最 左边 的 符号 a ERM). 

3)P 移动 输入 磁头 到 c 右边 的 第 一 个 符号 ( 即 y 的 第 一 个 字符 ) ， 不 改变 下 推 列表 ， 并 准备 用 
y 来 中 配 下 推 列表 。 

4)while 下 推 列表 的 顶端 符号 匹配 输入 磁头 扫描 到 的 符号 do 

begin 





O 如 果 n=0， 即 w= e， 那 么 P 正 在 扫描 a,, = $ (最 右 端的 标记 符 ) 。 
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从 下 推 列 表 将 顶端 符号 弹出 栈 ; 
输入 磁头 向 右 移动 一 格 
end 

5) 此 时 有 两 种 可 能 : 

a) 输 入 磁头 已 经 到 达 $ ， 即 右 端 的 终端 标记 符 ， 此 时 P 接受 输入 。 

b) 下 推 列表 的 顶端 的 符号 和 当前 的 输入 符号 不 匹配 。 既 然 之 前 串 y 和 下 推 列 表 一 直 是 匹配 
的 ， 因 此 己 可 以 恢复 其 下 推 列 表 ， 方 式 是 通过 向 左 移动 输入 磁头 ， 复 制 扫描 到 的 输入 到 下 推 列 
表 直 到 过 到 输入 符号 c。 这 时 ， 己 的 下 推 列表 的 内 容 为 caij,…a,Zo，1<is<sne。 如 果 i=n， 则 已 
在 非 最 终 状 态 下 停机 。 否 则 ，P 从 下 推 列表 中 将 a; 出 栈 ， 并 向 右 移动 输入 磁头 到 y $ 的 第 一 个 符 
S. fs P 回 到 步骤 4， 尝 试 找到 字符 申 a,,,…a, 的 前 级 yc 

可 以 看 到 ,PP 用 一 种 自然 的 方式 来 确定 y 是 否 是 x = 0,0,-0, NFR, P 轮流 对 i=1，2，…， 
n, ZAH a,a,,,…a, 的 前 缀 来 中 配 y。 如 果 找 到 匹配 ， 已 接受 y。 否 则 ，P 拒绝 y。 这 个 过 程 可 能 
BOR PHEOC I xl -lyi ) 次 移动 。 口 

$9.12 #BBAL=l|wl wea, b, cl, waxy Ņ El x! 22 Rx" =x} (BI w HHS 
BEKEN? 或 更 长 的 回 文 ) bbe RRR SAH, Webb)" 2bba, Hla, b, c) * PR 
每 个 字符 串 均 以 单个 字符 构成 的 回 文 gs，2 或 开头， 所 以 需要 施加 1 «| >2 WER, TAHE 
给 定 输入 串 oa …a, 时 ，2DPDA P KATH: 

1)P 移动 输 入 磁头 到 右 侧 终端 标记 符 ， 同 时 复制 输入 到 下 推 列表 。 这 样 ,， 下 推 列表 包含 
4.0,-1…Q201Zoo。 如果 n<2， 则 P 立即 拒绝 输入 。 

2) P 移动 输入 磁头 到 左 侧 终 端 标 记 符 ， 但 不 改变 下 推 列表 。P 将 输入 磁头 定位 在 左 侧 终端 标 
记 符 右边 的 第 一 个 符号 上 ， 即 指向 a 。 

3)while 下 推 列 表 的 顶端 符号 与 输入 磁头 扫描 的 符号 匹配 do 

begin 
将 下 推 列 表 的 顶端 符号 弹出 栈 ; 
输入 磁头 向 右 移动 一 格 

end 

4) 此 时 有 两 种 可 能 ， 

a) 下 推 列 表 只 包含 Z ， 此 时 己 停 机 ， 接 受 输入 。 

b) 下 推 列表 顶端 符号 和 当前 输入 符号 不 一 致 。 此 时 P 向 左 移动 输入 磁头 ,将 所 读 到 的 字符 
复制 回 下 推 列 表 的 相应 位 置 ， 直 到 遇 到 左 侧 终 端 标记 符 为 止 。 如 果 初 始 的 输入 串 是 aaea, W 
此 时 对 某 个 i, P 的 下 推 列表 中 有 a,---a,0,Z,. MRi=2, PSMA. BM, 从 下 推 列 表 中 
弹出 a;， 且 输入 磁头 向 右 移 动 一 格 ， 定 位 在 左 侧 终 端 标记 符 右边 的 第 一 个 符号 处 ， 然 后 P HET 
到 步骤 3。 

这 样 ，P 通过 对 每 个 i 尝试 匹配 c…aza 和 aia…a, 的 前 级 (2 大 i<n) ， 确 定 输入 串 aaea, 
是 否 以 回 文 开 头 。 这 个 过 程 可 能 需要 P 做 O(n’) KE. 口 

现在 证 明 算 法 能 够 在 0( wl ) 时 间 内 确定 2DPDA P BERSHAM ww， 而 无 需 考虑 P 事实 
上 做 多 少 次 移动 操作 。 在 下 文中 ， 假 设 围绕 固定 的 2DPDA P=(S, I, T, ô, s, Z, s 和 固定 
KE n 的 输入 字符 串 w 进行 讨论 。 

定义 P 的 一 个 表面 格局 (surface configuration, MARB) 是 一 个 三 元 组 (5，i，4) ， 其 中 ， 
seS, i 是 输入 磁头 的 位 置 ， 0<i<n+1, 4 是 TU1Z。| 中 的 一 个 下 推 列表 符号 。 


O 算法 第 一 次 运行 到 这 里 时 , i=1， 但 后 面 每 次 运行 到 此 时 ,i 将 递增 1。 
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注意 ， 尽 管 并 非 每 个 ID 都 是 一 个 格局 ， 但 一 个 格局 是 一 个 ID。 从 这 个 意义 上 说 ， 每 个 表面 
格局 可 表示 多 个 也， 即 表示 那些 下 推 列表 “表面 ”( 即 栈 顶 ) 和 格局 中 的 符号 4 相 匹 配 的 ID。 如 果 
存在 尸 的 移动 的 序列 ， 使 得 对 于 mmz0， 有 


C K(s,,i,,a,) 
FG, si „a, ) 
. FG, sim ,Qn ) 
Ec’ 


我 们 说 格局 C=(s, i, A) 导出 格局 C' G', i, A), WE Csc, RH, MHI, 有 1 al = 
29 。 在 这 个 移动 序列 里 ， 中 间 IDAs, i, o) 至少 有 两 个 符号 在 下 推 列表 中 。 因 为 不 同 的 格局 
只 有 0(n) 个 ， 而 用 到 的 不 辣 的 ID 数量 可 能 是 指数 级 的 ， 所 以 我 们 处 理 的 是 格局 而 不 是 ID. 

定义 如 果 对 于 格局 (5，i，4) ， 其 8(s，ai，4) 没 有 定义 或 者 形式 为 (9"，d，pop) ， 则 称 格 
E, i, 4) 是 最 终 的 (terminal) 。 也 就 是 说 ， 一 个 最 终 的 格局 将 引起 已 停机 或 者 从 下 推 列表 中 弹 
出 一 个 符号 。 格 局 C 唯一 的 最 终 格局 C'( 如 果 存 在 ) 满足 C 忆 C'， 这 里 之 表示 一 的 自 反 传 递 闭 包 ， 
则 称 C' 是 格局 C 的 终结 者 (terminator) 。 

例 9. 13 如 果 将 下 推 列表 的 长 度 看 做 是 P 所 做 移动 次 数 的 函数 ， 就 能 够 得 到 如 图 9-17 所 示 
的 曲线 。 在 这 幅 图 上 ， 用 每 次 移动 后 P 的 格局 (而 不 是 名) 来 标记 每 个 点 。 


下 推 列表 的 长 度 


e 





移动 次 数 
图 9-17 格局 序列 图 


例如 ， 从 图 9-17 中 可 以 看 到 CAC MA 2 在 栈 顶 ， 而 中 间 格 局 都 没有 ZERK, HLE 
得 出 结论 C, (C. WE Ci, 是 最 终 格局 ， 则 无 论 对 它 自己 还 是 对 CMA, C WERAK, MX 
个 图 上 还 可 以 推导 出 C, C,, C, C,, CS C, AX CARP 从 下 推 列表 中 弹出 一 个 符号 ， 所 
以 Co 是 最 终 格局 。 口 

下 面 两 个 简单 引 理 是 模拟 算法 的 关键 。 

引 理 9. 1 当 且 仅 当 存在 某 个 区 O<i<l wl +1, 使 形 如 (s:，i，2,) 的 格局 是 初始 格局 
(so, 1, Z,) 的 终结 者 时 ， PER w, 

HER: 这 个 结论 可 以 直接 从 2DPDA 如 何 接受 输入 字符 串 的 定义 得 到 。 口 

定义 ”如果 对 格局 CURE D, # CSD, WEXCED 的 前 驱 (predecessor)。 如 果 C=>D， 则 定 


XC D Hy HAW AK (immediate predecessor)。 如 果 格 局 对 (C，D) 和 格局 对 (C'，D') 满足 下面 四 个 
条 件 : | 


1)C=(s, i, A) D=(t, j, A) 





© 如 果 m=0, 那么 C 上 C'。 
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2)C =(s ), B) D'zQU, j', B) 
3) (s, i, A) FCs’, i’, BA) 
E 


4) (t, j', BA) FC, j, A) 

也 就 是 说 ， 如 果 P 能 够 通过 一 个 人 栈 (push) 移 动 操作 从 格局 C 转 到 C'， 通 过 一 个 出 栈 
(pop ) 移 动 从 格局 D' 转 到 D, WHR (C, D) 位 于 格局 对 (C， D’')ZF (below), (ER, 
(C, DD) 和 和 (C’',D') 可 以 不 同 也 可 以 相同 。) 

引 理 9.2 如果 格局 对 (C, DFC, D') 之 下 , BCSD', Wi CoD, 

证 明 ; 证 明 很 容易 ， 留 作 练 习 。 O 

$49.14 ÆR 9-17 F, (C,, C)MF(C,, G) F, ROB, CO MF(C,, CG) Fo R 
而 ， 因 为 CG, 和 C, 在 下 推 列表 的 顶端 可 能 没有 同样 的 下 推 符号 ， 所 以 不 能 确定 (C,，C ) 是 否 位 于 
(C;，C,) 之 下 。 口 

模拟 算法 通过 找到 输入 w 时 ，2DPDA P 的 每 个 格局 的 终结 者 。 一 旦 找到 初始 格局 (gq。，1， 
2 ) 的 终结 者 ， 算 法 就 结束 了 。 

用 数组 TERM 存储 每 个 格局 的 终结 者 。 假 设 格 局 已 经 ( 按 某 种 字典 序 ) 排 成 线性 有 序 的 序列 
了 。 接 着 用 把 格局 名 C 看 成 整数 ， 用 TERM[ C] 表 示 C 的 终结 者 。 

另外 ， 还 要 用 到 列表 数组 PRED, PRED 以 格局 作为 下 标 ，PRED[ D] 存 放 满 足 CD 的 所 有 
格局 C 的 列表 。 

除了 数组 TERM 和 PRED 外 ， 还 将 使 用 另外 两 个 列表 NEW 和 TEMP。 列表 NEW 包含 还 没有 
被 考虑 的 使 得 TERM[ C] =D 的 格局 对 (C，D)， 列表 TEMP 用 在 过 程 UPDATE(C，D) 中 ， 用 来 
存放 格局 C 的 前 驱 。 

执行 如 下 过 程 。 首 先 查看 C 是 否 为 最 终 格局 。 如 果 是 ， 则 设置 TERM[ C1 = C( 每 个 最 终 格局 
都 是 它 自己 的 终结 者 ) ， 且 把 (C，C) 加 到 NEW 中 。 然 后 考虑 在 P 的 一 次 移动 中 有 满足 CFD 的 
格局 对 (C，D) CER: 在 这 样 一 次 移动 中 ， 下 椎 列表 不 变 ) 。 

如 果 已 知 刀 的 终结 者 ， 则 对 于 所 有 已 知 是 C 前 驱 的 E， 包 括 C AC, 设置 TERM[E] =TERM[D] 
(可 以 在 PRED[C] 上 找到 C 的 前 驱 ) 。 同 时 ， 将 格局 对 (下 ，TERM[D] ) 添 加 到 列表 NEW h, 

如 果 还 不 知道 D 的 终结 者 ， 那 么 将 CEA D 的 直接 前 驱 列 表 PRED[D] 上 。 


此 时 ， 对 于 每 个 格局 C， 无 需 操 作 栈 就 可 以 确定 满足 CSD 的 唯一 的 格局 D, 并 且 D 是 C 的 
终结 者 或 者 对 于 1 al =2, D 上 (s，i，a) 。 现 在 考虑 所 有 已 经 加 到 列表 NEW 的 格局 对 。 一 般 而 


言 ，NEW 包含 尚未 考虑 的 格局 对 (4，B) ， 其 中 ， ASB, B 是 最 终 格 局 。 假 设 NEW 包含 格局 对 
(A, B), ， 从 NEW 中 移 走 格局 对 (4，B) ， 考 虑 位 于 (4，B) 之 下 的 每 个 格局 对 (C，D)。 如 果 DD 
的 终结 者 已 经 被 计算 ， 那么 设置 TERM[I C] = TERM[ D] ， 且 添加 格局 对 (C，TERM[D] ) 到 列表 
NEW H. XF PRED[ C] 上 的 每 个 E, 设置 TERM[E] =TERM[D]， 且 添加 (5，TERM[ D1]1) 到 列 
表 NEW F, Am, WR D 的 终结 者 还 没有 计算 ， 那么 将 C 放 到 列表 PRED[D] 中 。 继 续 这 个 过 
程 ， 直 到 NEW 为 空 为 止 。 此 时 ， 对 于 每 个 格局 C， 只 要 终结 者 存在 ， 就 一 定 能 确定 终结 者 。 

—H NEW 为 空 ， 观 察 TERM[ C,], ， 其 中 Co 是 初始 格局 。 如 果 TERM[ C] 是 一 个 接受 格局 ， 
则 可 知 2DPDA 已 接受 w， 和 否则 ， 已 拒绝 w。 

下 面 的 算法 将 更 加 精确 地 给 出 具体 细节 。 

算法 9.4 模拟 2DPDA 算法 。 

输入 : 一 个 2DPDA P=(S, I, T, 8, So, Zo, sD 和 一 个 输入 串 wel"*，,， lwl =n, 

输出 : 如 果 weL(P)， 则 答案 是 “yes”;， 否则 答案 是 “no”。 
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Ax: 

1) 初 始 化 数组 和 列表 如 下 : 对 每 个 格局 C, 设 TERM[ C] = ØM PRED[C] = 名 再 设 NEW = 
Ø, TEMP =Ø. 

2) 对 于 每 个 最 终 格局 C,， 设 TERM[C] =C 且 添 加 格局 对 (C，C) 到 NEW 中 。 

3) 对 于 每 个 格局 C， 确 定 在 一 次 移动 后 是 否 有 某 个 格局 D, 使 C 上 D。 如 果 有 ， 则 调用 过 程 
UPDATE(C，D)。 过 程 UPDATE 如 图 9-18 所 示 。 : 

4)34 NEW 不 空 时 ， 从 NEW 中 移 除 格局 对 (C'，D') ， 对 于 每 对 位 于 (C', D') 之 下 的 (C， 
D)， 调 用 过 程 UPDATE(C, D), 

5 ) 如 果 TERM[ C,] 是 一 个 最 终 格局 ， 这 里 C。 是 初始 格局 ， 那 么 回答 “yes”; 否则 回答 
“no” o 口 

例 9. 15 ”考虑 在 如 图 9-17 所 示 的 2DPDA 上 运用 算法 9.4 时 发 生 的 一 些 计算 。 












procedure UPDATE(C, D): 


comment 无 论 何 时 UPDATE(C, D) 被 调用 , Sf C= D; 
1. if TERM[D] = Ø then 将 C 添 加 到 PRED[D] 中 
else 


begin 
2. TEMP < (C); 
3 while TEMP x f do 


begin 
从 TEMP 中 选择 和 移 走 格局 B; 
TERMÍB] < TERMI[D); 
把 (B, TERM[D]) 加 到 NEW 上， 
for PRED[B] 中 的 每 个 4 do 把 4 添加 到 TEMP 中 
end 


Nays 





图 9-18 UPDATE 过 程 


步骤 2 确定 C,，Cs，Cs。，Cuo 和 C, 是 最 终 格 局 ， 因 此 它们 是 自己 的 终结 者 。 我 们 添加 格局 对 
(C,, €), (Cs, C), (6, Cy), (Cios Co) M(C,, Cn) 8) NEW P, 

步骤 3 调用 过 程 UPDATE(C,, C,). 。 这 时 ， 因 为 TERM[ C,] =Ø, UPDATE 只 把 C, 放 到 列表 
PRED[C:] 中 。 在 步骤 3， 还 调用 UPDATE (C,, Ce)o WX TERM[ C,] = C6， 所 以 UPDATE 设 
TERM[C,] =C., 且 添 加 (C;，G6) 到 NEW 中。 在 步骤 3 里 还 调用 了 UPDATE(C,, C), "E 
TERM[C,] = C,， 且 添加 (Cs ，C。) 到 NEW。 这 样 ， 在 步骤 3 执行 完 后 ，NEW 包含 如 下 的 七 个 格局 对 : 

(6,,C,),(6,,0,) Co C9) (CiosCio), (Cn,Cn), (Cs,Ce), (Cs,C,) 

在 步骤 4 中 ， 因 为 (C;，C;) 位 于 (C,，C,) 之 下 ， 所 以 从 NEW HERC, C), ， 并 调用 UP- 
DATE(C; ，C; ) 。 因 为 此 时 TERM[ C,] = C,, UPDATE it TERM[ C,] = C,， 并 且 添 加 (C，， C,) 81 
NEW 中 。 然 后 第 4 步 从 NEW PERC, C), RARE) (Cs，C) 之 下 没有 格局 对 ， 则 不 调 
用 UPDATE? 。 类 似 地 ， 对 于 格局 对 ( C,，C, ) ，( Co，Co)，(Cu，Cu) (GS, C). 我们 均 不 
调用 UPDATE 过 程 。 

当 从 NEW PERC, C, ) 时 ， 调用 UPDATE(C,, Co), f TERM[ C, ] =Cy, 并 添加 (C,， 
Co) 到 NEW 中 。 此 时 ，NEW &$(C,, C,)AI(C,, Cy). 

当 从 NEW 中 移 除 (C; C,) 时 ， 调 用 UPDATE(C,，C,)， 因 为 PRED[ C] 包含 C, ， 所 以 有 
TERM[ C,] = C,fll TERM[ C,] =Cw。 把 (C,，Cw) 和 (C,，Cw) 添 加 到 NEW H, 


O 为 了 简化 问题 ,假设 P 不 包括 图 9-17 未 包含 的 移动 。 
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请 读者 自行 完成 模拟 过 程 。 口 

3389.10 £3 9.4 4 O( wl ) 时 间 内 正确 回答 问题 “是 否 weL(P)?” 

iA. 可 以 证 明 ， 没 有 一 个 格局 会 重复 (多 于 一 次 ) 放 到 TEMP 上 。 这 样 ， 每 次 对 UPDATE 
的 调用 总 能 终止 。 也 可 以 证 明 没有 格局 对 被 重复 (多 于 一 次 ) 放 到 列表 NEW 上 ， 所 以 算法 本 身 总 
会 终止 。 作 为 练习 ， 这 两 部 分 的 证 明细 节 留 给 读者 。 

下 面 将 证 明 ， 在 当 且 仅 当 weL(P) 时 ,算法 9.4 的 结论 中 ，TERM[ C,] 是 最 后 格局 。 同 时 ， 
对 算法 9. 4 的 执行 步 数 进行 归纳 ， 很 容易 证 明 以 下 结论 : 

1) 如 果 TERM[ C] E, D, 那么 D BC 的 终结 者 。 

2) 如 果 将 C 添加 到 PRED[D] ， 那 么 C—D, 

3) 如 果 (C，D) 被 放 到 NEW 上 ,那么 TERM[C] =D, 

这 样 ， 如 果 算 法 9.4 发 现 TERM[ C,] 是 最 后 格局 ， 那 么 根据 引 理 9. 1，w e L(P) E. 

反之 ,必须 证 明 ， 如 果 D 是 C 的 终结 者 ， 那 么 TERM[ C] 最 终 被 设 成 D。 证 明 可 通过 对 序列 
C 医 DD 所 包含 的 移动 次 数 进行 归纳 得 出 。 归 纳 基 础 (0 步 移动 ) 是 显然 的 ， 因为 C=D， 在 算法 9.4 
的 第 2 步 TERM[ C] OR, D。 

在 归纳 步骤 中 ,假设 CFE 片 D， 有 两 种 情况 要 考 虚 。 

情况 1 EE 是 一 个 格局 ， 即 移动 C -E 并 不 是 一 个 push 或 pop 移动 ， 因 此 在 步骤 3，UP- 
DATE(C，E) 被 调用 。 如 果 此 时 TERM[E] 已 经 被 设 为 D, C 将 在 第 2 行 被 放 到 TEMP H, 最终 
TERM[C] 将 在 第 5 RRA D, ME TERM[E] 还 没有 被 设 为 Dp， 那么 在 UPDATE(C，E) 的 第 1 
行 , 将 C 添 加 到 PRED[E] 中 。 根 据 归纳 假设 ， 最 终 设置 TERM[E] = D。 如 果 这 个 设置 发 生 在 
UPDATE 的 第 5 行 ， 那么 C 将 在 第 7 行 被 添加 到 TEMP, TERM[ C] 在 调用 UPDATE 时 被 设置 成 D。 
因为 BD， 所 以 TERM[E] 不 可 能 在 算法 9.4 的 第 2 步 被 设 为 D( 如 果 EE=D， 那 么 在 第 3 步 考虑 
C 上 E 时 ，TERM[E] 已 经 被 设 为 D)。 因 此 得 出 结论 ， 在 第 一 种 情况 下 ，TERM[ C] 被 设 为 D。 

情况 2 EE 是 一 个 ID， 且 C FE 是 一 个 push Ba, JE BESESESIEES A, BAF, (C, F 
F(A, B)ZT, fi18A[* B, FI* Dp， 其 每 个 序列 所 含 的 移动 都 比 C 凸 D 的 序列 所 含 移动 次 数 少 
(格局 4 是 IDE 的 “表面 "格局 )。 根 据 归 纳 假设 ，TERM[4] 被 设 为 8B，TERM[ FIRRA Do 

假设 后 者 在 前 者 之 前 发 生 ， 即 TERM Fj] 先 被 设置 为 D， 而 后 TERM [4] 被 设置 为 8， 那 么 
(4，B) 最 终 被 放 到 NEW 中， 在 步骤 4，UPDATE(C, FF) 被 调用 。 因 为 此 时 TERM[ F] =D， 所 以 
在 算法 第 5 行 设 TERMI[C] 为 D。 

Ez, 假设 在 TERMLIP] 被 设 为 也 之 前 TERM[4] 已 经 被 设 为 8， 那么 当 UPDATE(C， 户 ) 被 
WARY, TERM[F] =Ø, wit C 被 加 到 PRED[F]。 但 是 ， 当 TERM[ FF] 被 计算 时 ，TERMI C] 被 
设 成 D。 这 样 ， 完 成 归纳 并 得 出 算法 4 的 正确 性 证 明 。 

考虑 算法 9. 4 的 运行 时 间 。 因 为 有 O(m) 个 格局 ， 所 以 步骤 1 和 2 需要 0(n) 时 间 。 因 为 对 于 
每 个 格局 ，2DPDA 至 多 有 一 个 可 能 的 移动 ， 所 以 就 有 至 多 0(n) 个 格局 对 (C，D)， 18 C LD, 
这 样 ， 在 步骤 3 至 多 调用 UPDATEO (n) K. 


当 C'SD'， 且 已 经 发 现 C' 的 终结 者 是 D' 时 ， 格 局 对 (C'，D') 被 放 到 列表 NEW 中 。 因 为 对 
于 每 个 格局 终结 者 是 唯一 的 (如 果 有 终结 者 的 话 ) ， 那 么 没有 格局 对 会 多 于 一 次 放 到 列表 NEW 
中 。 因 此 ， 放 到 列表 NEW 的 格局 对 总 数 不 会 超过 O(n) 。 对 于 每 个 放 到 NEW 上 的 格局 对 ， 只 有 
有 限 数 量 的 格局 对 位 于 它 之 下 。 因 为 如 果 (C,，D) 位 于 (C',D') 之 下 ,那么 C 和 C' 的 磁头 位 置 至 
多 相差 一 格 ， 类似，D 和 DD’ 的 磁头 位 置 也 至 多 相差 一 个 。 这 样 ，UPDATE 被 调用 了 0(n) 次 。 

现在 考虑 用 在 子 程序 UPDATE 的 总 时 间 。 可 以 证 明 ， 每 个 格局 在 PRED 数组 里 至 多 出 现 一 
次 ,也 没有 格局 会 多 于 一 次 被 放置 在 列表 TEMP 中 ， 这 样 ，UPDATE 的 第 4 ~6 行 的 执行 时 间 可 
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以 归结 为 从 TEMP 移 走 的 格局 B. 的 数量 ， 第 7 行 的 执行 时 间 可 以 归结 为 添加 到 TEMP 的 格局 4 的 
数量 。 因 为 UPDATE 至 多 调用 0(n) 次 ,可 以 得 出 ， 除 了 上 面 归结 到 格局 4 和 B 的 时 间 外 ，UP- 
DATE 花费 的 总 时 间 是 0(n) 。 因 此 ， 算 法 9.4 的 运行 时 间 是 线性 的 。 口 

本 节 所 得 到 的 结论 的 基本 应 用 是 证 明 某 些 问 题 存 在 线性 时 间 的 算法 。 我 们 已 经 看 到 ， 一 些 
模式 匹配 问题 能 够 形式 化 地 转换 为 语言 识别 问题 。 如 果 能 设计 一 个 2DPDA 以 接受 对 应 于 模式 匹 
配 问 题 的 语言 ， 那 么 就 知道 对 该 问题 存在 一 个 线性 时 间 的 算法 。2DPDA 对 长 度 为 n 的 输入 可 能 
做 吧 次 甚至 2* 次 移动 ， 这 个 事实 经 常 使 在 2DPDA 上 设计 一 个 算法 来 识别 语言 (这 个 语言 是 相应 
于 模式 匹配 问题 的 语言 ) 比 直接 在 RAM 上 设计 一 个 解决 模式 匹配 问题 的 线性 算法 更 为 容易 。 


9.5 位 置 树 和 子 串 标识 各 


上 节 已 经 证 明 ， 如 果 模 式 匹配 问题 能 够 形式 化 为 寻找 2DPDA 的 语言 识别 问题 ， 那 么 就 能 够 
在 线性 时 间 内 解决 最 初 的 模式 匹配 问题 。 可 以 直接 使 用 算法 9. 4 作为 解决 初始 问题 的 一 个 线性 时 
间 算 法 。 然 而 ， 由 模拟 产生 的 常数 因子 使 这 个 方法 并 不 是 非常 吸引 人 。 本 节 我 们 将 讨论 一 种 数据 
结构 ， 这 种 数据 结构 能 够 更 加 实际 地 应 用 于 线性 时 间 的 模式 匹配 算法 中 。 一 些 模式 匹配 问题 可 
以 应 用 这 种 数据 结构 ， 包 括 : 

1) 给 定 文本 串 x 和 模式 串 y， 确 定 y 在 * 中 的 所 有 出 现 。 

2) 给 定 文本 串 x， 确 定 x 的 最 长 的 重复 的 子 串 。 

3) 给 定 字符 串 x 和 y， 确 定 x My 的 最 长 公共 子 串 。 

定义 ”一 个 长 度 为 n 的 字符 串 中 的 位 置 (position) 是 1~n 之 间 的 整数 。 如 果 x=yaz, 且 1y 
| =i-1， 则 称 符号 a 出 现在 字符 串 x 的 位 置 i。 如 果 x=yuz，| yl =i-1， 有 除非 y =y， 否 则 不 
EKR yu, WEFR & 标识 字符 囊 %* PARE, BREN, ues 中 仅 有 的 出 现在 位 置 i 开 
始 。 例 如 ， 子 串 bba 标识 字符 串 abbabb 的 位 置 2。 子 串 bb 则 不 能 标识 位 置 2。 

在 本 章 的 余下 部 分 中 ， 设 * = wa…a, 是 某 个 字母 表 ! 上 的 一 个 字符 串 ，a,, = $ 是 一 个 不 在 
7 中 的 符号 ， 那 么 x$ = aa…a, 中 的 每 个 位 置 ; 至少 被 一 个 字符 串 标识 ， 即 a,a,,,…a, ,1。 我 们 
把 标识 x$ 中 位 置 ; 的 最 短 字符 串 称 为 * 中 的 位 置 i 的 子囊 标识 符 ， 记 作 s(i)。 

例 9. 16 BFE abbabb $ ， 图 9-19 列 出 了 其 位 置 1 ~7 的 子 串 标识 符 的 列表 。 口 

对 于 一 个 字符 串 *$ 的 各 位 置 的 子 串 标识 符 ， 可 以 方便 地 用 称 做 了 树 的 一 棵 树 来 表示 ， 树 中 
的 边 和 某 些 顶点 均 带 有 标记 。 

定义 ”一 棵 1 树 是 一 棵 带 标 记 的 树 T， 对 于 了 的 每 个 内 部 顶点 vz， 从 wv 出 发 的 边 用 字母 表 了 中 
的 字符 做 标记 。 如 果 了 中 的 边 (v, w) 标 记 为 a， 那 么 称 刀 为 v 的 a BT. 

FFP r$ =aa,…a,a,,1 的 位 置 树 ( position tree) 是 一 棵 (IU 1 $1) 树 ,其 中 a 在 I 中, 1<i 
<n, an= $, BRREU TRE: 

1)T 有 n+1 个 标记 为 1，2，…, n+l 的 叶子 。7 的 叶子 是 和 x$ 中 的 位 置 一 一 对 应 的 。 

2) 沿 着 从 根 到 标记 为 i 的 叶子 的 路 径 ， 所 经 过 的 边 的 标记 组 成 的 序列 是 ;(i) ， 即 位 置 i 的 子 
串 标 识 符 。 

例 9.17 字符 串 abbabb $ 的 位 置 树 如 图 9-20 所 示 。 例 如 ， 从 
根 到 标记 为 2 的 叶子 的 路 径 拼 出 的 字符 串 是 bba, 它 是 位 置 2 的 子 
串 标 识 符 。 口 

下 面 的 引 理 阐述 子 串 标识 符 的 几 个 基本 属性 。 

引 理 9.3 设 s(i) 是 字符 串 x$ =aa,…a,,! 的 位 置 i 的 子 串 标 
识 符 。 

1) 如果 s( 丫 长度 为 j， 则 s(i-1) 的 长 度 至 多 为 j+1。 图 9-19 abbabb $ 的 子 串 标识 符 
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2) RAF RRA ERA — 1 T RRR HR, 

证 明 : 

a) UA s(i-1 ) 的 长 度 大 于 7 +1, 则 有 某 个 位 置 kAi-1 90;.,0;770,,,., 7 0,0,,, 17 Akajo B 
Jt, aa, Gigs 70,,,04,,577 04,5, H a, a, PERA E i， 与 前 提 Qi iy jy 能 标识 位 置 ; 
矛盾 。 

b) 证 明 很 容易 ， 作 为 练习 留 给 读者 。 口 

作为 引 理 9. 3( 的 一 个 结论 ， 可 以 断定 事实 上 每 个 字符 串 «3 都 存在 一 棵 位 置 树 。 

许多 模式 匹配 问题 能 够 用 位 置 树 解决 ， 包 括 本 节 开 始 时 提 到 的 那些 问题 。 





图 9-20 一 棵 位 置 树 


例 9. 18 考虑 基本 的 模式 匹配 问题 :“y =b b,b Æ x = aa …as 的 子 串 吗 ?假设 构造 了 x$ 
的 位 置 树 7， 为 了 确定 y 2b b, ob RBA 的 子 串 ， 把 位 置 树 看 做 一 个 确定 型 有 穷 自 动机 的 转换 
图 。 也 就 是 说 ， 从 7 了 的 根 开始 ， 在 位 置 树 中 沿 着 最 长 的 可 能 路 径 ， 拼 出 8,5,…b,(0<j<<p)。 假 设 
这 个 路 径 在 顶点 sv 终止 ， 可 能 发 生 以 下 三 种 情况 。 

1) 如 果 j<p 且 顶点 v 不 是 叶子 ， 则 回答 “no”。 在 这 种 情况 下 ， 我 们 知道 5,5, b E x 的 子 
H, {E b,b,---b,b,,, Rio 

2) MR jap 且 顶 点 bz 是 一 个 标记 为 i 的 叶子 ， 那么 知道 8.8,…b 匹配 x 中 从 位 置 i 开 始 的 j 个 
字符 。 必 须 比较 9j,i0;, i. isp- Pl b, buo, 如 果 它 们 不 匹配 ， 那 么 答案 为 “no”; 否则 回答 
“yes” 且 报告 y 是 x 在 位 置 i 开始 的 子囊 。 

3) 如 果 j=p 且 顶 点 v 不 是 叶子 ， 那么 回答 “yes”。 在 这 种 情况 下 ，y 是 x 中 在 两 个 或 更 多 位 
置 上 开始 的 子 串 ， 这 些 位 置 由 位 置 树 中 顶点 " 的 子 树 所 包含 的 叶子 上 的 标记 给 出 。 

$49.19 位 置 树 能 够 用 来 在 给 定 的 串 x = aa …a, 中 找到 最 长 的 重复 子 串 ( 子 串 的 两 次 出 现 
可 能 有 重 玲 ) 。 最 长 的 重复 子 串 对 应 于 最 大 深度 的 位 置 树 的 内 部 顶点 。 这 样 的 顶点 能 够 用 一 种 直 
接 的 方式 进行 定位 。 

考虑 在 abbabb 中 查找 最 长 重复 子囊 。 在 如 图 9-20 的 abbabb $ 的 位 置 树 上 ， 有 一 个 深度 为 3 
的 内 部 顶点 ， 且 没有 其 他 更 深 的 内 部 顶点。 这 样 相 应 于 这 个 顶点 的 字符 串 abb 是 abbabb 中 最 长 的 
重复 子 串 。 标 记 为 1 和 4 的 叶子 表明 abb 两 次 出 现 的 开始 位 置 ， 且 它们 之 间 没 有 重 释 。 口 

现在 详细 考虑 位 置 树 的 构造 问题 。 本 章 余下 部 分 使 用 a,a,…a,a,,! 表 示 %*$ ， 其 中 a, EE 
一 的 右 端 标识 符 $ 。 用 ”表示 后 级 a.…asa,,,，1 <isn+1; As ORR x, POLL I BF HUS 
符 。 所 有 的 位 置 都 是 按照 初始 的 字符 串 aia…asa 中 的 位 置 顺序 编号 。 

下 面 将 给 出 构造 aa …asa,, 的 位 置 树 的 算法 ， 其 所 需 时 间 和 结果 的 位 置 树 中 顶点 个 数 成 比 


Q oa" 表示 n 个 a 连接 而 成 的 字 串 。 
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Bl, HEX a10,…a,o,,1 的 位 置 树 可 能 有 O(n’) BUR, BUM, abab" $° 的 位 置 树 有 nw +6n +2 
个 顶点 (对 此 读者 可 以 验证 )。 然 而 ， 在 对 “任意 ”字符 串 的 含义 进行 合理 假设 的 前 提 下 (如 从 固定 
的 字母 表 里 均 匀 且 独立 地 选 出 的 字符 构成 的 符号 串 ) ， 我 们 能 够 证 明 长 度 为 的 字符 串 的 一 棵 
“平均 ”位置 树 有 0O(m) 个 顶点 。 尽 管 这 里 不 给 出 证 明 ， 但 是 确 有 算法 可 从 一 个 给 定 的 字符 串 直 接 
构造 出 一 棵 压缩 形式 的 位 置 树 ， 其 所 用 时 间 最 坏 情况 下 为 0(n)。 参 考 文献 包含 了 对 这 个 算法 的 
引用 。 

因为 需要 在 下 面 的 算法 中 从 S E S, SE *: 子 串 标识 符 的 集合 ，$, ,是 x,: 子 串 标 识 符 的 
集合 ， 所 以 ， 先 考虑 $ 和 5,,, 之 间 的 区 别 。 一 个 明显 的 区 别 是 5; 包 含 s,(i) ， 即 包含 «的 第 一 个 位 
置 的 子 串 标识 符 。 由 于 3 包含 这 个 串 ， 所 以 $ ,的 上 位 置 的 子 串 标识 符 可 能 不 再 是 8 中 下 位 置 的 
子 串 标 识 符 。 当 且 仅 当 s (0 Æ s, (2) VAT Ci, CE) JE S; .中居 位 置 的 子 串 标识 符 ) ， 这 种 情况 
出 现 。 在 这 种 情况 下 ， 必 须 加 长 5,,1(8) 得 到 s,(k)(s;(k) 是 5; 中 位 置 的 子 串 标识 符 )。5;,, 中 不 
可 能 有 两 个 子 串 标 识 符 都 需要 加 长 。 假 设 ;,,, (hk ) 和 s,,(%) 都 需要 加 长 ， 则 这 两 个 字符 串 将 都 
是 s,(i) 的 前 级 ， 因 此 一 个 将 是 另 一 个 的 前 缀 ， 与 引 理 9.3(45) 蔬 盾 。 




















图 9-21  abbabb $ 的 部 分 后 缀 的 子 串 标 识 符 


例 9.20 设 ala,…a,a,,) =abbabb $ , x, - abb $ , x, = babb $ , x, = bbabb $ 3 x, = abbabb $ 的 
子 串 标识 符 如 图 9-21 中 的 列表 所 示 。$: 是 在 3S, 上 只 加 了 一 个 5,03) = ba 得 到 。 另 一 方面 ，5, 需 要 
作 两 个 改变 得 到 9 : 增加 s,(2) =bba | S,"h, 在 %(5) 的 末尾 添加 $ BB s,(5) = 由 $。 为 了 得 
到 $, ， 需 要 增加 5 (1) s abba 到 S,, Æ s,(4) EEH bb $ 485] s, (4) abb $ , 口 

考虑 从 T, (表示 5,,, 的 位 置 树 ) 构 造 T, CRUS. 5, 的 位 置 树 ) 涉 及 的 相关 操作 。 给 定 TL, 
必须 添加 一 片 叶子 到 四， ， 这 片 叶子 相应 于 s,(i) ， 标 记 为 i。 对 (i<k<n)， 如 果 s,,,(k) 是 
5 的 前 级 ， 那 么 必须 在 7,,, 中 延长 从 根 到 标记 为 上 的 叶子 的 路 径 ， 所 以 了 中 标记 为 的 新 
叶子 将 相应 于 s,(k) 。 由 此 可 见 ， 有 效 地 从 Ti 构造 T(x%; 的 位 置 树 ) 的 关键 是 能 够 很 快 找到 
TRB y, fif ay 是 x MRK, Bes, WR, BAe ay 是 否 了, 中 的 一 个 子囊 标 
识 符 的 前 级 。 

构造 需要 关联 三 个 新 的 结构 到 一 棵 位 置 树 上 。 第 一 个 结构 是 一 个 位 向 量 (数组 )， 将 它 和 位 
置 树 7 的 每 个 顶点 相关 联 ， 用 B, 表 示 顶 点 v 的 位 向 量 ,/ 中 的 每 个 符号 在 8B, 中 有 一 个 向 量 分 支 。 
ETP, EDA o 对 应 字符 串 y Hoel, RA, 如果 ay 是 x 的 子囊 ， 则 B8,[aj] 是 1; 否则 B, [Ca] 
是 0。 

接 下 来 ， 将 位 置 树 上 的 每 个 顶点 的 深度 关联 到 顶点 上 。 随 着 树 之 渐 长 大 ， 这 个 信息 很 容易 
更 新 ， 因 此 后 面 假设 它 会 随 之 计算 更 新 而 不 再 具体 提 及 这 个 过 程 。 

最 后 需要 增加 到 位 置 树 的 是 一 个 新 的 树 结构 ， 该 树 结构 建立 在 位 置 树 的 顶点 上 。 我 们 称 这 
个 树 结构 为 “辅助 树 ”， 事 实 上 它 是 定义 在 位 置 树 顶 点 上 的 另 一 个 边 的 集合 。 
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a) bbabb$ 的 位 置 树 


图 9-22 


定义 设 卫 是 xi =aiaii…as 雪 的 位 置 树 ， 了 的 辅助 树 (auxiliary tree) 树 是 一 棵 (IU | SA, 
满足 以 下 条 件 ; 

1. 4, 和 了 ,的 顶点 集 一 样 。 

2. 如 果 ay HRTEM AONE, y 是 下 中 对 应 顶点 的 字符 串 ， 那 么 在 4 中 ， 顶 点 
w 是 顶点 v 的 a 儿子， 这样 在 4, 中， 从 根 到 w 的 路 径 可 拼 出 ya( 民 表示 反 转 。 一 一 译 者 注 )， 而 
在 中 从 根 到 ww 的 路 径 可 拼 出 ay, 

例 9.21 x, = bbabb $ 的 位 置 树 和 辅助 树 如 图 9-22 所 示 ( 叶 子 上 的 编号 和 = abbabb $ 的 字符 
位 置 对 应 )。 输 助 树 的 叶子 不 一 定 是 位 置 树 的 叶子 ,但 是 它们 的 项 点 集合 是 一 样 的 。 口 

从 定义 不 能 很 明显 地 看 出 一 棵 位 置 树 是 否 有 辅助 树 。 事 实 上 ， 对 于 一 棵 任意 的 1 树 ， 可 能 没 
有 辅助 树 。 下 面 的 定理 给 出 了 一 棵 树 拥有 辅助 树 的 条 件 。 

定理 9.11 一 棵 了 树 了 拥有 辅助 树 的 充分 必要 条 件 是 ， 如 果 了 人 中 有 一 个 顶点 相应 于 字符 惠 
ax, XBacel, xel, 那么 也 有 一 个 顶点 相应 于 字符 串 x, 

证 明 : 留 作 练 习 。 口 

推论 每 棵 位 置 树 都 有 辅助 树 。 

证 明 : 如 果 ax 是 位 置 i 的 子 串 标识 符 的 前 缀 ， 那 么 根据 引 理 9.3(a) , x 是 位 置 i+1 TR 
标识 符 的 前 缀 。 口 

现在 准备 给 出 从 T, (xi 的 位 置 树 ) 计算 T, Co BS IEEE) 的 算法 。 

算法 9.5 AT, HE To 

输入 : 一 个 串 aaan FRE xi = a;,.…a,a,,1 的 位 置 树 T,, 和 辅助 树 Aio 

输出 : FIFE x BIBLIO 7 和 辅助 树 4,。 

Fik: 

l. ÆT, PRIRA i+) 的 叶子 (这 是 最 后 加 到 7,,, 的 叶子 ); 

2. 遍历 从 这 片 叶子 到 7,, 的 根 的 路 径直 到 史 到 顶点 u,, 使 得 B la] =1( 顶 点 w, 相 应 于 最 长 
Wy, 使 得 aiy 是 x 的 一 个 前 级 ， 也 是 x,,, 的 位 置 k 开 始 的 一 个 子 串 ，i <k<n)。 如 果 没 有 这 样 
的 顶点 存在 ， 继 续 遍 历 直 到 根 ; 

3. 在 从 标记 为 i+1 的 叶子 到 uw 的 儿子 的 路 径 上 的 每 个 顶点 v, 设 B,[a,] =1; 如 果 u E 
在 ， 则 对 从 标记 i+1 的 叶子 到 根 的 路 径 上 的 每 个 顶点 v， 设 置 B,[a,] =1。( 在 这 条 路 径 上 的 每 个 
顶点 相应 于 x, 的 某 个 前 缀 *。 因 此 ， 很 明显 ciz eax, FB.) 

4. i) f£ 凡 不 存在 ， 则 转向 情况 1; 

ii ) 否则 ， 如 果 在 辅助 树 4,,, 上 ,没有 a 儿子， 则 转向 情况 2; 
ii) 和 否则， 如 果 在 辅助 树 4,., 中 ， 必 有 一 个 @ 儿 子 风 ， 则 转向 情况 3 。 
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顶点 v, 相 应 于 位 置 树 T, PÉ) ay. 

情况 1 a 是 不 出 现在 x,,, 中 字符 ， 这样 ， 位 置 i 的 子 串 标识 符 就 是 a,。 为 了 从 工 ,, 构 造 7， 
作 如 下 操作 。 

1) 创 建 一 个 新 叶子 ， 标 记 为 i， 作为 也 ,的 根 的 a JLF; 

2) 对 所 有 ael, 设 B[la]=0。 

为 了 从 4, 构造 4;,， 将 标记 为 i 的 新 顶点 作为 4,, ,的 根 的 a 儿子。 

情况 2 a 出 现在 x,,, 中 ,但 是 只 有 ay 的 某 个 前 缀 出 现在 7,,, 中 ( 拼 出 一 条 从 工 ,, 的 根 到 某 
片 叶 子 5 的 路 径 ) 。 这 种 情况 出 现在 7,,, 中 位置 k(i<k<n) 的 子 串 标识 符 必须 延长 ， 才 能 成 为 7 
中 位 置 上 的 子 串 标识 符 时 。 假 设 y = aaa， 时 子 由 相应 于 a,a,,,--a,, p<j, BA, HF v, 
标记 为 下，aiai… 思 是 了 中 位 置 大 的 子 串 标识 符 ( 即 a;2,,, 2, 22,2,,,778)) e 

为 了 从 7,,, 构 造 7,， 增 加 一 棵 子 树 到 顶点 v, 上 ， 这 棵 子 树 带 着 两 片 新 叶子 ,分别 标 记 为 i 和 
k。 在 这 棵 增加 的 子 树 中 ， 从 bv, 到 上 的 路 径 拼 出 字符 串 a ,a4,,…a,,!， 从 vv 到 i 的 路 径 拼 出 字符 
82,,0,,78,,, HH a,,,0,:7a, = 4114012…0;o。 这 样 ， 从 了 的 根 到 叶子 的 路 径 将 拼 出 a, 
Qn"…anQnri， 这 是 %; 中 位 置 的 新 子 串 标识 符 ， 从 根 到 叶子 i 的 路 径 将 拼 出 aia,,,…ajaj,1， 这 是 
x POLE i NT BRR. 

为 了 从 也 ,构造 有， 具体 步 又 如 下 。 

1) 在 7.,, 中 沿 着 从 ,到 根 的 路 径 找 到 ,uz 是 4,,, 中 有 a 儿子 的 的 第 一 个 祖先 ， 记 这 个 a, 
儿子 为 wm。 在 了 中， 顶点 岂 是 标记 为 大 的 叶子 ，i < 和 mn。 从 顶点 岂 中 移 走 标记 大 

2) u,, uy, cc, up, uE T, PAu Du RELA. BEM u$] u,, BIE 
Ae, 1 和 h<g， 从 uw 到 ,的 分 支 标记 为 c<,，， 如 图 9-23 所 示 ( 在 上 面 讨论 中 ，ciez…cy =4,,,0,,.°° 
a, 70,,0,5774,) 3; 

DETH, UE qg 个 新 顶点 v,， 0, oov, vy, Wo, 
成 为 名 的 6 儿子 (1<h<gq)， HE v Æ ob c JLF; 

4) 设 j 为 i 与 u 的 深度 之 和 ，m 是 上 与 ,的 深度 之 和 ， 
给 7 两 个 标记 为 i 和 上 的 新 叶子 ,使 叶子 i 是 vb 的 a,, 儿 子 ， 
叶子 上 是 ww 的 oa, 儿子 ; 

S) MAAR cael MATA lo, v. 0, v vy, kl PRY 
v, 4 Bla] - B.[a]; 

6) MMA ael, $ Bla} =0。 

为 了 从 4,,, 构 造 4,， 需 作 如 下 工作 。 

7) 使 成 为 4, 中 的 bv 的 a 儿子 ; 

SWEET, Pul a, JLF, 使 标记 为 i 的 新 叶子 成 
A AP wH a JLF; 

9) & uE T, a P u ban JLT, 使 标记 为 大 的 新 叶子 
成 为 4, 中 u" B5 a JLF; 

10) fii v, RA AP uh a JLF, 2<h<g。 

情况 3 A, PuR—Aa 儿子 w， 分 两 种 情况 图 9.23 情况 2 中 工 的 重要 部 分 ， 
ZE. BRAR 4 中 的 边 

a) v, dé 7 中 标记 为 下 的 叶子 ， 这 种 情况 发 生 在 s. (i) 
=a; aaj I si (k) 7a,a,,,"-a, BT, XH aa, an 70,0;,,70,, 这 是 情况 2 的 特例 ， 此 
Bf, v, =o, ATAT HET, Ao BERW k, A 5, 一 个 标记 为 i 的 aj, 儿子 ， 和 标记 为 上 的 
an+i 儿 子 。 该 构造 细节 和 情况 2 中 除去 步骤 3、7 和 10 后 是 一 样 的 。 
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b)s, 是 7T,, 中 的 内 部 项 点， 这 种 情况 发 生 在 5S, =S Ufs) o ETAT, HX T,, 
可 简单 地 给 v, 一 个 @,, 儿 子 (w, 原 先 没有 a,, 儿 子 )， 且 标记 这 个 叶子 为 i。 详 细 的 算法 如 下 。 

1) 设 j 是 i 与 4, 的 深度 的 和 ; 

2) 在 7 中 ,使 标记 为 i 的 新 顶点 成 为 v, 的 aj, 儿子 (注意 ， 由 y 的 极 大 性 ， 即 y 是 使 得 ciy 是 
«ARR AOR, ÆT, a P oR AREA a, JLF); 

3) 对 所 有 的 ee7,， WB [a] =0, BUS aya REx, TE, 因此， 对 任意 4a，aaiyaj, 一 
定 不 是 % 的 子 串 ; | 

4) 为 了 从 4,,: POA, ET, PRA uw RA u W an ULP CE T, P, u AEF 
ya ) ， 使 新 顶点 i 成 为 4,,1 中 的 a 儿子 (在 4, 中 ,i 将 对 应 于 a,1y"a;)。 

在 情况 3(5) 中 提 到 的 顶点 之 间 的 关系 如 图 9-24 所 示 。 口 

例 9.22 taaa, =abbabb $, it T, MA, 
是 图 922 中 的 树 。 从 7 和 4,， 应 用 算法 9.5 构造 T, 
和 4,。 因 此 ,这 里 i=1, a, =a, 

首先 ， 定 位 标记 为 2 的 叶子 ,因为 B,[a] =0， 
所 以 设 B [a] =1， 并 且 在 图 922 中 向 上 移动 到 v Tii 
点 ， 在 顶点 u, REA abb 是 bbabb $ HTE, P 
以 B,[a] =1。 这 样 ， 顶 点 是 ww。 现在 找 出 vs,， 即 
A,'P u 的 a 儿子。 由 于 不 存在 ， 所以， 属于 情 
52. 

T,"h u BI C Tl PX w YE A, PRA a 儿子。 然而 ， 
w 的 父 顶 点 r 有 顶点 4 作为 其 a 儿子。 因此， 在 情 
况 2 的 第 1 步 ， 我 们 发 现 v 是 7T, 和 4, 中 标记 为 4 
的 项 点 。 在 步骤 2， 我 们 发 现 g=2, wu -rflu- wow 情况 3(b) 中 的 重要 部 分 , 两 条 
w, 25h, o= =b, BibiEZ EG, eg — 3v 标记 o, 的 虚线 是 4, 中 的 边 
点 v， 使 v 是 7 中 标记 为 4 的 顶点 的 5 儿子 (在 也 
中 顶点 4 已 经 不 使 用 这 个 标记 ， 而 用 v,)。 同 时 也 创建 了 v,， 并 使 其 成 为 的 5 儿子 。 

在 第 4 步 ,， 计 算得 到 j=3。 因 为 项 点 wv 以 前 的 标记 是 4， 所 以 算得 m =6。 我 们 发 现 
a Ea, a,,,7 $， 这 样 ， 标 记 为 1 和 4 的 新 顶点 分 别 作为 v 的 a 儿子 和 $ LF. WT, 
925 所 示 。 余 下 的 步骤 留 作 练习 。 口 

引 理 9.4 如 果 Ti 和 和 4,,, 是 x%,,, 的 位 置 树 和 辅助 树 ， 那么 ， 根 据 算法 9. 5 构造 的 T, $n AJ 
%i 的 正确 的 位 置 树 和 辅助 树 。 

ER: 假设 ,是 5,,, 的 表示 ，5;,, 是 x%,, 中 各 位 置 的 子 串 标识 符 的 集合 ，4,,, 是 7, 的 辅助 
树 ， 则 5, 有 两 种 可 能 : 

1.5, =S U {s;(i) | 3 

2. S,=S,,, - {s,,,(k)} Ufs: (k), s, (GO) (ick<n), 

第 一 种 可 能 性 由 算法 9. 5 的 情况 1 和 情况 3(6) 所 覆盖 。 第 二 种 可 能 性 包含 在 情况 2 和 3(a) 
中 ， 和 情况 1 ~3 中 需要 的 算法 正确 性 的 证 明和 推导 包含 在 算法 的 描述 中 。 口 

可 使 用 如 下 过 程 构造 任意 字符 串 的 位 置 树 。 
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图 9-25 最 后 的 位 置 树 T, 图 9-26 ”位 置 树 的 初始 图 


算法 9.6 构造 一 棵 位 置 树 。 

输入 : 一 个 字符 串 x$ =a,--a,0,,,, mel, 1&in Ha, = $o 

输出 : x$ 的 位 置 树 了。 

LE 

L. S 也 ,是 如 图 9-26 所 示 的 位 置 树 ， 且 对 所 有 的 ael, $B, [a] =B,,,[a] =0; 

2. 令 4,,, 是 和 图 9-26 一 样 的 辅助 树 ; 

3. for ie-n step-1 until 1 do 用 算法 9.5 M T, AA, AE TM Ao 口 

定理 9. 12 在 与 位 置 树 T 了 中 的 顶点 数 成 比例 的 时 间 内 ， 算 法 9.6 构造 x$ 的 位 置 树 。 

证 明 : 算法 9.5 的 步骤 1 能 够 在 固定 时 间 内 找到 叶子 i+1， 将 叶子 i+1 加 到 式 ,, 时 保持 指向 
该 叶子 的 指针 ， 当 把 叶子 i 加 到 7 中 时 ， 设 这 个 指针 指向 叶子 i。 

步骤 2 和 3 每 次 执行 的 工作 量 明显 地 与 从 顶点 i+1 遍历 到 wu, 的 路 径 长 度 成 比例 ， 步 骤 1 的 
每 次 执行 的 工作 量 是 常量 。 情 况 1 ~3 中 任何 一 种 情况 的 执行 需要 的 时 间 都 和 添加 到 树 中 的 顶点 
数 成 比例 ， 对 此 ， 读 者 可 以 容易 地 进行 验证 。 这 样 ， 算 法 9. 5 的 各 部 分 的 执行 时 间 除 了 步骤 2 和 
3 外 都 是 和 7 的 规模 成 比例 的 。 

我 们 仍 需 证 明 在 7 中 (1<i<n) ， 顶点 i+1 和 也 (如 果 忆 不 存在 ， 则 是 顶点 ;+1 和 根 ) 之 
间 的 距离 的 和 不 大 于 7, 的 规模 。 记 这 些 距 离 为 d,，d,,，…, dras 用 e,(1<i<n+1) 表 示 了 中 顶 
点 i 的 深度 ， 对 情况 1 ~3 作 简单 的 分 析 可 得 : 


e; Sei, dn +2 (9-1) 
如 果 计 算 i 从 1 取 到 的 式 (9-1) 两 边 的 和 ， 可 发 现 
Y d, &2n te, 一 el (9-2) 
从 式 (9-2) 立 即 得 到 : 算法 9.5 85450 2.303 的 执行 时 间 是 0(n) ， 因 此 ， 该 时 间 至 多 和 7 了 的 
规模 成 比例 。 口 


正如 前 面 提 到 的 ， 一 个 长 度 为 n 的 字符 串 的 位 置 树 可 能 有 0(m ) 个 顶点 ， 因 此 ， 任 意 模 式 匹 
配 算法 构造 这 棵 树 的 时 间 复 杂 度 都 是 0(n ) 。 然 而 ， 可 以 通过 将 位 置 树 里 所 有 链 浓缩 成 单个 顶点 
来 “压缩 位置 树 和 辅助 树 。 一 条 链 是 一 条 路 径 ， 其 所 有 顶点 恰好 有 一 个 儿子 。 不 难 证 明 ， 对 于 
长 度 为 n 的 字符 串 ， 其 压缩 位 置 树 至 多 有 4n -2 个 项 点。 压缩 树 能 够 表示 和 初始 的 位 置 树 一 样 的 
信息 ， 这 样 ， 能 够 用 在 同样 的 模式 匹配 算法 中 。 

对 算法 9.5 进行 修改 ， 能 够 在 线性 时 间 内 产生 压缩 的 位 置 树 和 辅助 树 。 这 里 没有 给 出 修改 算 
法 ， 是 因为 它 和 算法 9. 5 PKU, 事实 上 在 许多 应 用 中 ， 会 希望 位 置 树 的 规模 和 输入 捉 的 长 度 线 
性 成 比例 。 在 参考 文献 中 给 出 了 关于 位 置 树 的 压缩 算法 及 其 一 些 应 用 的 资料 。 
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习题 


9.1 试 给 出 有 穷 自动 机 的 正则 表达 式 和 状态 转换 图 ， 用 于 描述 如 在 字母 表 1= (a, b] ESSERE 
串 的 正则 集 。 
a) MAU a 开头 和 结尾 的 字符 串 ; 
b) 所 有 不 带 两 个 连续 a 的 字符 串 ; 
* c) 所 有 带 奇 数 个 a 和 偶数 个 b 的 字符 串 ; 
*d) MARAE TR aba 的 字符 串 。 
9.2 试 证 明 图 9-1 的 NDFA 接受 的 集合 是 (a € b) * aba, 
9.3 ” 试 构造 NDFA 接受 如 下 的 正则 集 。 
a) (a*b)'(aa * bb); 
b) a'b’ «b'a'; 
c) (a+e)(b+e)(c+e)s 
9.4 试 证 明正 则 集 的 补 集 还 是 正则 集 。 
*9.5 试 证 明 如 下 的 字符 串 集 合 不 是 正则 集 
a) lab | nel}; 
b) {wwl weia, b] |; 
c) [wl wela, b}"， 且 w=w"| | 即 回 文 的 集合 } 。 

9.6 给 定 字 符 串 x= aa …a,，a 是 正则 表达 式 。 试 修改 算法 9. 1 以 找到 最 小 的 上 ， 并 且 在 找到 大 
后 ,继续 查找 (a) 最 小 的 j 和 (b) 最 大 的 j,， 使 得 wa, 在 o 表示 的 集合 里 。[ 提示 : 使 用 
整数 j 与 5, 中 的 每 个 状态 相关 联 。] 

*9.7 令 x 和 a 的 定义 和 习题 9.6 一 样 。 试 修改 算法 9. 1 ， 找 到 最 小 的 J/， 并 且 在 找到 j 后 ， 找 到 最 
KKI k, EI aaa 在 “表示 的 集合 里 。 

9.8 令 x 和 a 的 定义 和 习题 9.6 一 样 。 试 构造 算法 ， 找 到 x 的 所 有 子 串 ， 这 些 子 串 是 a 所 表示 

集合 里 的 字符 串 。 并 且 分 析 算 法 的 时 间 复 杂 度 。 
*9.9 了 是 字母 表 ， 人 好 是 不 在 了 中 的 符号 ，SWDC (string with don't cares) 是 TU | | EAA. 
称 SWDCb,b,---b, TE (LR. i 匹配 SWDC a,a,…a,， 如 果 对 于 所 有 的 j(i<j<n), 或 者 a = 
bi 或 者 a;、6,,, 中 有 一 个 为 0。 试 证 明 对 于 固定 的 字母 表 I， 确定 一 个 SWDC 匹配 另 一 
个 SWDC 的 位 置 集合 的 问题 是 和 与 -或 乘积 问题 ( and-or multiplication ， 即 计算 c; Vid; A 
e XX c, d fll e 是 布尔 变量 ) 在 渐 近 时 间 复 杂 度 上 是 等 价 的 。 
*+9.10 ” 试 证 明确 定 一 个 SWDC 匹配 另 一 个 SWDC 的 位 置 能 够 在 0,(n log’n log log n) 时 间 内 完成 。 
[提示 : 结合 习题 9 9 和 Schonhage-Strassen 整数 乘法 算法 的 结果 。] 
AER a1a,…a, 和 61b,…b,， 试 找到 一 个 0(n) 算 法 来 确定 是 否 存 在 一 个 k，1<hk<n, 使 
得 a, - baia gains LESSEN 
9.12 ” 试 使 用 算法 9 3 为 如 下 字符 串 y 构造 机 器 : 
a) abbbbabbbabbaba 
b) abcabcab 
9.13 ” 试 证 明定 理 9.8。 
9.14 RSi, ys o, y, 是 字符 串 集合 ， 试 设计 算法 以 找到 S 中 字符 串 作 为 文本 串 * HF 
串 的 所 有 出 现 ， 并 分 析 算 法 的 时 间 复 杂 度 。 
+9.15 ” 试 构造 2DPDA 接受 如 下 语言 。 


a) [xcyicy ey, | mB1, xela, b], ye fa, b], 1&ism, y, y,, o, 中 至 少 
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*9, 17 


** 9, 18 


*x 9, 19 


9. 20 


*9.21 


9. 22 


* 9. 23 


有 一 个 是 x 的 子 串 } ; 
b) [xy l x fiy E& ^, | yl žl}; 
c) {x,cx, ex, | x, e la, b], 1 imn, RAW x, f^; 
d) | 0x47 ex, dy, cy, cy, | 每 个 x, fll y,f£|a, b] rh, BHRT i Hj, 8 Xi = 好。| 
考虑 满足 如 下 规则 的 2DPDA P: 
6(s0, a, Zo) =5(s,, a, A) = (sq, +1, push A), 
(s, $, 4) =(s,, -1), 
6(s, a, A) =8(s,, a, Z,) =(s,, -1, pop), 
(5, €, Zo) * (5$, 0), 
a) 试 列 出 输入 aa 的 己 的 所 有 表面 格局 ， 
b) 试 使 用 算法 9. 4 计算 数组 TERM, 
假设 2DPDA 在 一 个 移动 中 能 够 从 位 置 i(n 是 输入 长 度 ) 移 到 如 下 的 每 个 位 置 。 
a) 到 位 置 n -i 
b) 到 位 置 i/2 
c) 到 位 置 n/2 
d) 到 位 置 logn 
试 证 明 这 些 修改 中 没有 一 个 增加 了 2DPDA 的 识别 能 力 。 考 虑 能 否 在 不 增加 2DPDA 的 接受 
能 力 的 情况 下 再 增加 一 些 其 他 能 力 。 
试 构造 一 个 2DPDA 接受 语言 
{w wrw,w;w,wsu | Wis, W2, wela, b}*, uela, b]*], 
[ 提示: 设 * 是 输入 串 ， 写 一 个 子 程序 找到 最 短 的 w, BE wwiy = x。 然 后 递归 运用 这 个 子 
程序 以 确定 y 左 部 的 符号 。] 
试 给 出 识别 如 下 语言 的 线性 时 间 算 法 : 
a) lww^! wel'|", 
b) [ww'ul w, uel', | w| Si}; 
c) [ww w, asfla，b”"， 每 个 由 是 一 个 非 空 的 偶数 长 度 的 回 文 } 。 
试 构造 一 个 线性 算法 对 字符 串 a.a,…a, 和 b.5,…b,， 找 到 最 长 的 1， f a 2, a RE bbb, 
的 子 串 。 并 考虑 算法 怎样 用 来 测试 一 个 给 定 的 字符 串 是 否 回 文 。 
下 面 四 个 习题 涉及 下 推 自 动机 的 一 些 变形 。 
上 磁头 2DPDA 是 在 输入 带 上 有 上 个 独立 的 读 磁头 的 2DPDA。 试 证 明 能 够 在 O(n") REST PI 
确定 长 为 n 的 输入 字符 串 可 否 被 磁头 2DPDA 所 接受 。 
单 向 下 推 自 动机 从 不 向 左 移动 输入 磁头 。 非 确定 型 下 推 自动 机 在 每 步 移 动 时 都 有 0 个 或 多 
个 选择 。 这 样 ， 下 推 自 动机 有 四 种 类 型 : 1DPDA，1NPDA, 2DPDA 和 2NPDA。1NPDA 接 
受 的 语言 叫做 上 下 文 无 关 语言 。 
a) 试 证 明 | wew" | we la, bt”) RERI LDPDA 所 接受 ; 
b) 试 证 明 |ww" | we ic， 外 “| 能 够 被 INPDA 所 接受 ; (这 个 语言 不 可 能 被 任何 1DPDA 所 
接受 。) 
c) RUE [wwx] w, xela, b], | wl 之 1 能 够 被 2NPDA 所 接受 。( 这 个 语言 不 可 能 被 
任何 1NPDA 所 接受 。) 
试 证 明 语言 工 由 乔 姆 斯 基 上 下 文 无 关 语法 范式 所 产生 ， 当 且 仅 当 工 可 被 一 个 INPDA 所 


接受 。 


*9.24 ” 试 证 明 能 够 在 0(n ) 时 间 内 确定 长 度 为 "的 输入 串 能 否 被 一 个 2NPDA 所 接受 。 
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9.25 试 为 以 下 的 字符 串 找 到 位 置 树 。 

a) baaaab $ ; 
b) abababa $ , 

9.26 试 证 明 a'b"a^b^ $ HRA n +6n+2 个 顶点。 

*9.27 ” 试 证 明 ， 如 果 所 有 位 置 的 字符 都 是 从 国定 的 字母 表 中 独立 且 均 匀 地 挑选 出 来 的 ， 那 么 随机 
输入 字符 串 x 的 位 置 树 有 OCT x1 ) 个 顶点 。 

9.28 试 为 习题 9.25 中 的 位 置 树 找到 : 

a) 辅助 树 ; 
b) 每 个 顶点 ”的 位 向 量 B,。 

9.29 试 证 明 每 棵 位 置 树 有 一 棵 辅助 树 。 

9. 30” 试 通过 证 明 能 够 从 了,, 和 4,,, 正 确 地 构造 了 和 4; 来 完成 引 理 9. 4 的 证 明 。 

*9.31 WRI r 的 位 置 树 是 怎样 用 来 测试 y,，y,，…，y。 中 的 任何 一 个 是 否 x 的 子 串 ， 且 所 需 时 
Sly) thy +…+1y,1 成 比例 。 

9.32 设计 一 个 算法 ， 找 到 两 个 已 知 字符 串 * My 的 最 长 公共 子囊 ， 并 分 析 算 法 的 时 间 复 杂 度 。 

9.33 ”对 于 给 定 的 字符 囊 x 和 4b.8,…b,， 设 计 一 个 有 效 的 算法 为 每 个 i，1<i<p， 找 到 是 6.b,,,… 
AT T PIT TET 

9.34 给 定 字母 表 了 7 上 的 字符 串 x = aa a, Hl y 20,5, b, BETEILIGT HI y 的 形 如 
字符 串 c,c,…c, 的 最 短 表示 ， 这 里 每 个 是 了 中 的 一 个 符号 ， 或 者 是 表示 x 的 一 个 子 串 的 
符号 。 例 如 ， 如 果 * =abbabb, y=ababbaa, 那么 [1: 2][4: 6]aa 是 长 度 为 4 的 y 的 一 个 
表示 ， 符 号 [i: jJ] OR x HFP aa, nau; (RF: 使 用 习题 9. 33 的 结论 。] 

9.35 试 证 明 长 度 为 二 的 字符 串 的 压缩 位 置 树 至 多 有 n2 个 顶点 。 

林 9.36 设计 一 个 0(n) 算 法 为 长 为 n 的 字符 串 构 造 压缩 位 置 树 。 

9.37 ZRx =a a, a fi y = b b,--b B) — "91, WEHR i <i, <- <i, aa, = 
b, b, b; CB x J& y 中 的 0 个 或 多 个 符号 被 删除 后 得 到 的 字符 串 )。 试 设计 一 个 O(lx! 
“1 y1) 的 算法 来 找到 x My 的 最 长 公共 子 序列 。 

9. 38 给 定 字符 串 * 和 y， 设 计 一 个 算法 以 确定 为 实现 * 转换 到 y 所 需 的 最 短 的 单个 符号 的 插入 
和 删除 的 操作 序列 。 

研究 型 问题 

9.39 习题 9. 10 中 的 时 间 限 制 能 够 进一步 改善 吗 ? 

9.40 为 了 确定 正则 表达 式 a 表示 的 语言 中 的 字符 串 是 否 % HTB, Ol a1 1 x1) 时 间 是 否 
必要 ? 

9.41 一 个 k 磁 头 2DPDA 能 够 在 0(ww ) 时 间 内 被 一 台 RAM 所 模拟 ( 习题 9 21) 。 那 么 每 个 上 下 文 
无 关 语言 都 能 够 被 2 磁头 2DPDA 接受 吗 ? 如 果 能 ， 那 么 每 个 上 下 文 无 关 语 言 都 能 够 在 
O(n’) fa] A — 6 RAM 所 接受 。 

9.42 存在 不 能 被 2DPDA 接受 的 上 下 文 无 关 语 言 吗 ? 

9.43 存在 能 够 被 2NPDA 接受 、 但 不 能 被 2DPDA 接受 的 语言 吗 ? 

9.44 习题 9. 37 中 的 时 间 界 限 能 够 改善 吗 ? 请 查阅 Aho, Hirschberg 和 Ullman[ 1974] 基 于 决策 树 
模型 所 得 到 的 时 间 下 界 的 结论 。 

文献 与 注释 


Kleene[ 1956 ] 研究 了 有 穷 自 动机 和 正则 表达 式 之 间 的 等 价 性 。Rabin 和 Scott[ 1959] 研究 了 非 
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确定 型 有 穷 自 动机 ， 并 证 明了 它们 与 确定 型 有 穷 自动 机 的 等 价 性 。 正 则 表达 式 的 模式 匹配 算法 
(算法 9. 1) 是 Thompson[ 1968] 所 提出 的 算法 抽象 。Ehrenfeucht 和 Zeiger[ 1974] 讨论 了 NDFA 作为 
模式 规范 设备 的 复杂 度 问 题 。 一 个 字符 串 和 另 一 个 字符 串 的 线性 匹配 算法 (算法 9.3) 来 自 于 Mor- 
ris 和 Pratt[ 1970 ] 。 作 为 习题 9. 21 的 扩展 ，Cook[ 1971a] 研 究 了 2DPDA 的 线性 模拟 。Gray、Harri- 
son 和 Ibara[ 1967 ] 研究 了 2DPDA 的 属性 特征 。Aho、Hopcroft 和 Ullman[ 1968 ] 研究 了 双向 非 确定 
型 PDA 的 O(n’ ) 模 拟 算法 (习题 9. 24) 。 习 题 9 15(b) 来 自 D. Chester 的 研究 ， 习 题 9. 19(c) 来 自 
F V. Pratt。 习 题 9. 19(c) 的 解决 方案 包含 在 Knuth 和 Prattf 1971] 的 研究 里 。 

9.5 节 关 于 位 置 树 和 压缩 位 置 树 的 材料 来 自 于 Weiner[ 1973] 。 习 题 9. 20 2389.31 ~ 9. 36 
的 解决 方法 及 其 几 个 相关 应 用 的 内 容 可 在 Knuth[ 1973b ] 的 研究 中 找到 。Karp、Miller 和 Rosenberg 
[1972] 的 论文 也 包含 了 一 些 令 人 感 兴趣 的 关于 重复 子 串 的 模式 匹配 算法 。 关 于 SWDC 匹配 的 习 
题 9.9 和 9.10 来 自 于 Fischer 和 Paterson[ 1974 ] 的 研究 ，Wagner 和 Fischer( 1974 ] 的 研究 则 包含 了 
习题 9. 38 的 解决 方案 。 这 篇 论文 和 Hirschberg[ 1973 ] 阐述 了 习题 9. 37 中 的 公共 子 序列 问题 的 
算法 。 


第 10 章 NP 完全 问题 


一 个 问题 的 计算 量 应 该 是 多 少 才能 将 其 评估 为 真正 的 难题 ? 普遍 的 观点 认为 ， 如 果 一 个 问 
题 不 可 能 在 少 于 指数 时 间 内 解决 ， 那 么 这 个 问题 应 该 认为 是 完全 不 易 处 理 的 。 这 个 “分 级 模式 ” 
意味 着 有 多 项 式 时 间 界 的 算法 问题 是 易 解 的 。 尽 管 诸如 2" 这 样 的 指数 函数 的 增长 比 任 何 n 的 多 
项 式 的 函数 增长 得 快 ， 但 对 于 一 些 较 小 的 4 值 ，0(2") 时 间 界 的 算法 可 能 比 多 项 式 时 间 界 的 算法 
更 有 效 。 例 如 ，2" 的 值 在 n 达到 59 之 前 都 小 于 n”。 然 而 ,一 个 指数 函数 的 增长 速度 是 爆炸 性 
的 ， 如 果 解 决 相应 问题 的 所 有 算法 都 至 少 是 指数 时 间 复 杂 度 的 ， 那 么 就 可 以 说 它 是 不 易 解 决 的 。 

这 一 章 将 证 明 有 一 类 问题 ， 即 非 确 定 多 项 式 时 间 完 全 问题 (简称 “NP 完全 "问题 )， 很 可 能 只 
包含 不 易 解决 的 问题 。 这 类 问题 包括 许多 “典型 的 "组 合 数 学 问题 ， 如 旅行 商 问 题 、 哈 密 顿 回路 
问题 、 整 数 线性 规划 问题 ， 以 及 所 有 已 证 明和 这 一 类 问题 “等 价 的 "问题 。 从 这 个 意义 上 说 ， 如 
果 一 个 问题 是 易于 解决 的 ， 则 所 有 的 问题 都 是 易于 解决 的 。 数 学 家 和 计算 机 科学 家 已 经 对 这 类 
问题 中 的 许多 研究 了 数 十 年 ， 但 对 其 中 任何 一 个 问题 都 没有 找到 多 项 式 时 间 界 的 算法 ， 很 自然 
可 推测 不 存在 多 项 式 时 间 的 算法 ， 因 此 ， 可 认为 这 一 类 中 的 所 有 问题 是 不 易 解决 的 。 

本 章 还 将 考虑 第 二 类 问题 ， 叫 做 “多 项 式 空间 完全 "问题 ， 它 们 至 少 和 NP 完全 问题 一 样 难以 
解决 ， 但 还 不 能 证 明 它们 是 不 易 解决 的 。 第 11 章 给 出 了 一 些 目前 我 们 能 够 证 明 是 不 易 解 决 的 
问题 。 


10.1 非 确定 型 图 灵机 问题 


下 面 将 看 到 ，NP 完全 问题 理论 背后 的 关键 点 是 非 确定 型 图 灵机 问题 ?。 我 们 已 经 讨论 过 非 
确定 型 有 穷 自 动机 ， 机 器 每 一 步 移动 都 可 能 进入 几 个 状态 中 的 某 一 个 。 类 似 地 ， 一 个 非 确 定型 图 
灵机 在 每 一 步 都 有 有 穷 数目 的 移动 可 供 选 择 。 如 果 对 输入 串 x*， 至 少 存在 一 个 移动 序列 导致 机 器 
到 达 一 个 接受 的 即时 描述 (ID) ， 则 称 输入 串 x 可 被 机 器 接受 。 
| 给 定 输入 *， 我 们 能 够 把 非 确定 型 图 灵机 M 想象 成 能 并 行 执行 所 有 可 能 的 移动 序列 直到 机 器 

到 达 接 受 ID 或 者 不 可 能 进行 任何 移动 为 止 。 也 就 是 说 ， 在 机 器 作 了 i 次 移动 后 ， 我 们 能 够 认为 
存在 多 个 M 的 “副本 ”， 每 个 副本 表示 一 个 内 在 ;i 步 移动 之 后 的 但 。 在 第 (i+1) 步 移动 时 ， 如 果 
在 副本 C 的 IDC 下 ， 图 灵机 对 下 一 步 移动 有 j 种 选择 ， 则 此 时 副本 C 将 自身 复制 成 7 个 副本 。 

这 样 ， 输 入 * LM 可 能 的 移动 序列 可 以 排 成 一 棵 ID 树 。 树 上 从 根 到 叶子 的 每 条 路 径 都 表示 
一 个 可 能 的 移动 序列 。 如 果 o 是 终止 在 接受 ID 的 最 短 移 动 序列 ， 那 么 ， 一 旦 完成 | ol 个 移动 ， 
M 就 停机 且 接 受 输入 x*。“ 用 ”在 处 理 x* 上 的 时 间 是 o 的 长 度 。 如 果 输 入 x 没有 移动 序列 导致 MM 进 
人 接受 ID,， 那 么 M 拒绝 *， 且 对 处 理 x 所 用 的 时 间 不 作 定义 。 

认为 M 只 “猜测 "在 序列 o 中 的 移动 ， 且 验证 o 确实 终止 在 一 个 接受 卫 上 ， 那 么 问题 的 处 
理 常 常会 很 方便 。 然 而 ， 一 个 确定 型 机 器 在 正常 情况 下 不 可 能 事先 猜测 出 一 个 到 达 接 受 ID 的 移 
动 序列 ， 因 此 一 个 针对 M 的 确定 型 模拟 必须 按照 某 种 顺序 找 出 M 在 x 上 的 所 有 可 能 的 移动 序列 
树 ， 直 到 发 现 一 个 终止 在 接受 ID 的 最 短 序列 为 止 。 如 果 没 有 移动 序列 导致 M 进入 接受 状态 ， 那 
么 除非 有 一 个 关于 最 短 接受 序列 的 长 度 边界 有 先 验 的 限制 ， 否 则 MM 的 确定 型 模拟 可 能 永远 进行 





O 不 熟悉 图 灵机 的 读者 可 参阅 1.6 节 。 
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FE. RH, ARMS: 在 非 确定 型 图 灵机 能 够 执行 的 任务 中 ， 有 一 些 是 不 能 被 确定 型 机 器 
在 同等 时 间或 空间 复杂 度 下 完成 的 。 然 而 ， 一 个 重要 的 开放 问题 是 ,是否 有 语言 能 被 某 固定 时 间 
或 空间 复杂 度 的 非 确定 型 图 灵机 接受 ， 但 是 不 能 被 同样 时 间或 空间 复杂 度 的 确定 型 图 灵机 所 
接受 。 

定义 “一 个 天 带 非 确 型 定 图 灵机 (简称 NDTM)M 是 一 个 7 TAQ, T, 1, 8, b, qs 9), 
这 里 所 有 的 元 素 都 和 普通 的 确定 型 图 灵机 的 含义 一 样 ， 除 了 移动 函数 6 现 是 从 QxT 到 Qx(Tx 
和 工 ，R，S| )* 的 子 集 的 映射 ， 即 ， 给 定 一 个 状态 和 卡带 符号 列表 , 5 返回 下 一 次 移动 可 进行 的 有 
BURBS, 每 个 选择 包含 一 个 新 的 状态 、 天 个 新 的 磁带 符号 和 天 个 磁头 的 天 个 移动 。 注 意 ， 
NDTM M 可 能 选择 这 些 移动 中 的 任何 一 个 ， 但 是 它 不 可 能 从 一 个 移动 中 选择 状态 而 从 另 一 个 移动 
中 选择 新 的 磁带 符号 ， 或 者 作 任何 其 他 的 移动 组 合 。 

NDTM 的 即时 描述 ID 的 确切 定义 和 确定 型 图 灵机 ( DTM) 一 样 。 一 个 NDTM M = (Q, T, I, 
8，b，g。，gi) 确 定 当前 的 状态 比如 g， 再 查看 个 磁头 扫描 的 每 个 符号 ， 比 如 六 ，X，…，XX，， 
从 而 来 作 一 次 移动 操作 。 然 后 从 集合 0(4, X. XL, oo, X ORBE SU (n, (Y, D), ，…， 
(了 Y,，D,) ) ， 该 特殊 元 素 规 定 了 新 状态 为 -， 在 第 i 个 磁带 上 输出 了 以 代替 XX， 并 在 D, 表 明 的 方 
向 上 (1<isk) 移 动 第 i 个 磁头 。 如 果 IDC 在 选择 了 下 一 个 移动 后 变 成 IDD, ij Cla DCF RM 
经 常 被 从 上 省 略 ) 。 注 意 ，NDTM M 中 可 能 有 几 个 D, 满足 C FD, BE, NUR M 是 确定 性 的 ， 
则 对 每 个 C 至 多 有 一 个 这 样 的 D。 

对 于 某 个 上 > 1， 如 果 有 C, HC, e BC, 或 者 如 果 C = C,， 则 记 为 C, C,。 如 果 NDTM M 
HCW, gos gos s o)l Cas as es a), RE a (以 及 此 后 的 ，o ，…，a ) 中 的 某 个 
位 置 上 有 最 后 的 状态 符号 g,， 则 称 NDTM M 接受 字符 申 w。MM 接受 的 语言 记 作 ZL(MH) ， 是 1 接受 
的 所 有 字符 串 的 集合 。 

例 10.1 设计 一 个 NDTM 接受 形 为 10"10*…10* 的 字符 串 ， 存 在 某 个 集合 TE 11，2，…， 
kh, ATi, = Lieto HRB, ME w 代表 的 整数 列表 ii ，i，…， 能 够 分 割 成 两 个 子 列 
表 ， 其 中 一 个 子 列表 上 的 整数 和 等 于 另 一 个 子 列表 上 的 整数 和 ， 则 w 将 被 接受 ， 这 个 问题 叫做 
分 割 问题 。 已 经 证 明 当 整 数 用 二 进 制 编码 ， 问 题 的 规模 看 成 二 进 制 整数 列表 的 长 度 时 ?， 该 问题 
是 NP 完全 的 。 

下 面 设计 一 个 3 NDTM M 来 识别 这 个 语言 。 它 从 左 到 右 扫描 它 的 输入 磁带 ， 每 次 扫描 一 
个 0 块 到 达 0*, i 个 0 将 不 确定 地 添加 到 带 2 或 带 3 上 。 当 到 达 输 入 末尾 时 ，NDTM 将 检查 它 是 
否 已 经 在 带 2 上 和 带 3 上 放置 了 相等 数量 的 0， 如 果 是 ， 则 接受 。 这 样 ， 如 果 按 某 种 选择 序列 将 
各 个 i 放 到 一 个 集合 ( 带 2) 或 者 另 一 个 集合 ( 带 3) 中 导致 两 集合 内 的 整数 和 相等 ， 则 NDTM 将 接 
受 。 而 导致 带 2 和 带 3 上 的 整数 和 不 相等 的 移动 序列 则 不 在 考虑 范围 ， 只 要 至 少 有 一 个 选择 序列 
导致 接受 即 可 。 形 式 上 记 作 


M=(|g, gq, *…, g}, {0, 1, b, $}, {0, 1}, 8, b, qos gs), 
其 中 移动 函数 8 如 图 10-1 所 示 。 
图 10-2 表明 NDTM 对 输入 1010010 可 能 作 的 许多 移动 序列 中 的 两 个 。 第 一 个 导致 接受 ， 第 
二 个 则 没有 。 既 然 至 少 有 一 个 移动 序列 导致 接受 状态 ， 那 么 NDTM 接受 1010010, 口 


O ”因为 元 素 可 能 有 重复 ， 所 以 是 一 个 列表 而 不 是 一 个 集合 。 

O ”正如 将 看 到 的 ， 用 来 表示 一 个 问题 的 编码 是 非常 重要 的 。 不 难 证 明 例 10. 1 的 NDTM 接受 语言 的 时 间 复 
AR HEESE EOS Om (0) , ， 这 里 = 是 使 用 DTM 时 输入 字符 串 的 长 度 。 然 而 ， 如 果 用 二 进 制 对 输入 进行 编 
码 ， 输 入 的 长 度 为 i ，i ，…， 避 诸 对 数 之 和 ， 同 样 的 策略 将 得 到 一 个 Om (ec") 算 法 ， 这 里 的 4 是 二 进 制 
输入 的 长 度 ，c> 1。 
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定义 ”如 果 对 于 每 个 接受 的 长 度 为 n 的 输入 囊 有 某 个 至 多 包括 T(n) 次 移动 的 序列 导致 
NDTMM 进入 接受 状态 ， 则 称 NDTMM 的 时 间 复 杂 度 为 7(n)。 如 果 对 于 每 个 接受 的 长 度 为 n 的 输 
入 字符 串 有 某 个 移动 序列 导致 NDTMM 进入 接受 状态 ， 在 任何 一 个 带 上 至 多 有 S(n) 个 不 同 的 单 
元 格 被 扫描 ， 则 称 1 的 空间 复杂 度 为 S(n)。 

例 10.2 例 10.1 的 NDTM 的 时 间 复 杂 度 为 2 +2( 最 坏 的 情况 是 输入 为 n 个 1)， 空 间 复杂 
度 为 n+1。 其 他 合理 的 分 割 问 题 的 编码 也 能 得 到 相同 的 复杂 度 。 例 如 ， 用 B(i) 表示 整数 i 的 二 
进 制 编码 ， 设 
L, = |8B(i,) 8B(C5) -8BCL) | 存在 一 个 集合 1C11,，2，…,k|， 使 得 = Yi 
这 里 # 是 一 个 特殊 的 标记 符号 。 为 了 识别 5 ， 可 设计 一 个 新 的 NDTMM, ， 它 的 操作 类 似 于 图 10-1 
中 的 NDTM M。 然 而 ，M, 不 是 将 0 块 复制 到 带 2 或 带 3， 而 是 将 一 个 二 进 制 数 存储 在 带 2 和 带 3。 
在 输入 带 上 遇 到 的 每 个 新 的 二 进 制 数 被 加 到 存储 在 带 2 或 带 3 的 数 上 。 





t # 





| RSEGIAGEIS. RENE 
$a 

这 里 选择 是 否 将 下 一 块 写 到 带 2(92 ) 或 
带 3(0) 


b 








复制 0 块 到 带 2。 然 后 ， 若 在 带 1 过 到 1， 
则 回 到 状态 9 ; 如果 在 带 1 遇 到 2， 则 转向 
状态 gq4 ， 比 较 带 2 和 3 的 长 度 





和 状态 9 基本 相同 ， 只 是 写 到 带 3 上 














比较 带 2 和 带 3 的 长 度 。 























接受 
图 10-1 NDTM 的 移动 ， 每 行 代表 一 个 选择 


aT Sh FB UR i, , i, ei, MOREA AB x = #B(i,)#B(i,)--#B(i,), AT 
的 问题 ，M 将 使 用 输入 串 =10"10”…10*， 它 的 长 度 可 能 是 % 的 指数 级 。 这 样 ， 尽 管 M, 在 某 种 
意义 上 比 图 10-1 中 的 NDTM 快 指数 系数 级 ， 但 由 于 M, 的 输入 已 经 相应 缩短 ， 其 时 间 和 空间 复杂 
度 仍旧 是 O(n), ZE n 是 输入 的 长 度 。 T 

通过 模拟 可 以 证 明和 任何 NDTM 接受 的 语言 也 能 被 DTM 接受 ， 但 是 在 时 间 复 杂 度 上 似乎 要 付 
出 很 多 。 还 可 以 证 明 模拟 的 时 间 复 杂 度 的 最 小 上 界 是 指数 级 的 。 也 就 是 说 ， 如 果 T(n) 是 一 个 合 
理 的 时 间 复 杂 度 函 数 (合理 性 是 指 “ 时间 上 可 构造 的 ”， 该 概念 将 在 第 11 章 定义 ) ， 那 么 对 于 每 个 
T(n) 时 间 界 的 NDTM M， 可 以 找到 一 个 常数 c 和 一 个 DTM M' 使 得 L(M) =L(M'), H M' 的 时 间 
复杂 度 为 On(c ”) 。 

上 面 结论 的 证 明 可 以 通过 构造 一 个 DMM ' 并 使 用 一 个 穷 举 算法 来 模拟 M 的 实现 。 首 先 ， 存 
在 某 个 常量 4， 在 任何 情况 下 ，M 的 移动 都 不 会 多 于 d 种 选择 。 这 样 M 的 多 达 T(n) 个 移动 的 序 
列 能 够 用 字母 表 = 10，1，…, 4 -1} 上 长 达 7(n) 的 字符 串 来 表示 。A 履 ' 模 拟 MEKE n hoti 
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Ax 上 的 行为 ， 描 述 如 下 : M' 连 续 地 按 字典 序 产 生长 度 至 多 T(m) 的 工 * 上 的 所 有 字符 串 ， 这 样 
的 字符 串 不 会 多 于 (d+1) 人 个。 一 旦 产生 了 新 串 w，M' 就 开始 模拟 o,, IE o, Ah w 所 代表 
的 M ABS, Mo SRM BS se, MAM HES, WME cr, 不 代表 的 一 个 有 效 的 移动 
序列 ， 或 者 如 果 ur, 没有 引起 W ES x, MAM AY * 中 的 下 一 个 字符 串 来 重复 这 个 过 程 。 

M' 能 够 在 时 间 Om(T(n) ARH o,。 它 至 多 使 用 Ow (T(n)) 时 间 产 生 每 个 字符 串 w， 因 
此 ，NDTMM 的 整个 模拟 可 能 耗费 时 间 Om(T(n) (d+1)”")， 至 多 是 Ot (77), HP, c BR 
个 常量 。 模 拟 细 节 留 作 练 习 。 


(991010010, qo, go) (991010010, go, qo) 
F(q,1010010, $4, $4) F(g,1010010, $4, 
F(14,010010, $5, $49) F(1g,010010, $9, 
F(105,10010, $05, $9) (109, 10010, 
F(10g,10010, $0q,, $4,) +( 104, 10010, 
F(1015,0010, $094, $94) ] F (10164,0010, 
F(10105,010, $0g,, $0g;) | F(10105,010, 
+(10100g,10, $093, $004.) | +( 101009, 10, 
+(10100g,10, $0q,, $00g,) +(10100q, 10, 
+(101001g,0, $0g;, $00q,) T F(1010014;0, 
HF-(1010010g, ，$ 00g, ，$ 00g, ) | F10100109,, 
[-(1010010g,, $04.0, $0q,0) F(10100105,, q4 $, 
F(1010010g,, $4,00, $ 4,00) 停机 ， 没 有 下 一 个 ID 
F(1010010g,, 9, $00, q, $00) 
}-(1010010g;, gs $00, q; $00) 
接受 





















































10-2 ”对 于 一 个 NDTM 的 两 个 合法 的 移动 序列 


然而 ,需要 强调 ,已 知 用 DTM 模拟 NDTM 的 非 平凡 的 时 间 下 界 。 也 就 是 说 ， 还 不 知道 是 否 
有 语言 能 够 被 某 个 时 间 复 杂 度 T(n) 的 NDTM 接受 , 但 是 不 能 被 同样 时 间 复 杂 度 的 任何 DTM 接 
受 。 比 较 而 言 ， 空 间 复杂 度 的 相关 问题 更 令 人 乐观 。 

定义 ”对 于 函数 S(n)， 如 果 存 在 一 个 DTIMM， 当 给 定 长 度 为 n 的 输入 时 ， 它 将 在 一 个 带 的 
第 S(n) 个 格子 上 放置 一 个 特殊 的 标记 符 ， 而 在 任何 带子 占用 的 单元 数 不 超 过 S(n) 个 ， 则 说 函数 
S(n) 是 空间 可 构造 的 。 大 多 数 常 用 函数 ， 如 多 项 式 ，2", n! 和 [nlogp(n+1) |]， 都 是 空间 可 构 
造 的 。 

可 以 证 明 ， 如 果 S(n) 是 一 个 可 构造 的 空间 复杂 度 函 数 ，M 是 空间 复杂 度 为 S(n) 的 NDTM, 
那么 存在 一 个 DIMM' 使 得 L(M) =L(M') ， 且 M' 的 空间 复杂 度 为 0(S (n)). 

M' 可 以 模拟 M 的 策略 是 分 治 法 的 一 个 有 趣 应 用 。 如 果 对 于 带 NDTM M - (Q, T, I, 8, b, 
qo，9:) ， 其 空间 复杂 度 为 可 构造 函数 S(n) ， 那 么 存在 常数 <， 使 得 当 输 入 长 为 的 字符 串 时 ，M 
需要 进入 的 不 同 的 IJD 数量 至 多 为 e*”。 一 个 更 加 精确 的 界 是 上 QE «CU TH +18 x (SQ), 
其 第 一 个 因子 表示 状态 的 个 数 ， 第 二 个 因子 限定 了 磁带 格子 内 容 的 可 能 数量 ， 最 后 一 个 因子 则 
限制 了 可 能 的 磁头 位 置 的 数量 。 这 样 ， 如 果 CL C, ， 那 么 存在 某 个 序列 ， 使 得 M 在 至 多 cs 次 


移动 内 从 IDC, 转 到 IDC, 。 可 以 通过 对 所 有 的 C, ， 测 试 是 否 在 至 多 ;i 步 移动 内 有 Cy C; 和 在 至 多 
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i 步 移动 内 有 CE C, ， 从 而 测试 是 否 在 至 多 2i 步 移动 内 有 Ch Co 

M' 之 后 的 策略 是 通过 如 下 的 算法 10. 1 来 确定 是 否 给 定 的 初始 IDC, 能 够 转 到 某 个 接受 ID, 

算法 10. 1 NDTM 的 确定 型 模拟 算法 。 

输入 : 一 个 空间 复杂 度 为 S(n) 的 NDTMM， 一 个 长 度 为 的 输入 串 w， 这 里 5(n) 是 空间 可 
构造 的 。 

输出 : 如 果 weL(M) 则 输出 “yes”; 否则 输出 “no”。 

方法 : 在 图 10-3 里 的 递归 过 程 TEST( C, , C, i) 用 于 确定 是 否 在 至 多 i 步 内 有 CO C. 4 
果 是 ， 则 返回 值 true， 否 则 返回 false。 在 整个 算法 中 ，C, 和 C, 在 任何 带子 上 使 用 的 单元 数 都 不 
超过 S(n)。 ， 

完整 的 算法 是 对 每 个 接受 IDC;， 调 用 过 程 TEST( C,，C,，csm ) ，C, 是 输入 为 w 的 M 的 初始 
ID。 如 果 发 现 这 些 调用 的 任何 一 个 值 为 tue， 则 回答 “yes”; 否则 回答 “no" 。 口 


procedure TEST(C,, Cz, i): 

if i= 1 then 
if C, | C, or C, = C, then return true 
else return false 

else 


begin 
for each ID C, 在 任何 的 磁带 上 使 用 的 格子 数 不 多 于 5(n) 个 do 
if TEST(C,, Cs, [i/21) and TEST(C,, C,. Li/2]) then 
return true; 
return false 
end 





图 10-3. ”过程 TEST 


定理 10.1 UR M 是 一 个 复杂 度 为 空间 可 构造 函数 S(m) 的 NDTM， 那 么 存在 一 个 空间 复杂 
度 为 0(S (mn) ) 的 DTM M', 使 得 L(M) =L(M')。 

证 明 : 证 明 是 算法 10. 1 的 一 个 图 灵机 实现 。 由 2.5 节 ， 可 以 知道 如 何在 RAM. 上 模拟 递归 过 
程 TEST， 能 够 在 图 灵机 上 使 用 同样 的 堆栈 策略 。 既 然 TEST 的 空间 耗费 参数 是 长 度 为 0(S(n)) 
的 ID， 那么 必须 在 一 个 磁带 上 安排 对 应 于 这 个 规模 的 栈 帧 ;而 Sn) 是 空间 可 构造 的 事实 可 确保 
我 们 进行 这 样 的 操作 。 检 查 TEST 可 以 看 到 每 次 调用 TEST 时 ， 它 的 第 三 个 参数 基本 上 是 TEST 的 
调用 过 程 的 第 三 个 参数 的 1/2。 因 此 ， 可 以 证 明 任何 时 候 栈 帧 的 数量 都 不 超过 1 + log [67 1, Æ 
O(S(n) ) 阶 的 。 既 然 每 帧 有 O(S(n) ) 单 元 被 使 用 ， 则 图 灵机 中 用 于 栈 的 单元 总 数 是 0(S (nm) ) 。 
图 灵机 构造 的 余下 细节 留 作 练习 。 M 

为 了 简化 证 明 ， 可 将 注意 力 集中 在 单 带 图 灵机 上 。 下 面 的 引 理 指出 如 果 愿 意 在 计算 时 间 上 
付出 一 些 代 价 ， 那 么 就 可 以 将 精力 集中 在 单 带 图 灵机 上 。 

引 理 10. 1 如 果 工 被 一 个 时 间 复 杂 度 T( n) BB kA NDTM M - (0, T, 1, 8, b, qo, q) HE 
受 ， 那 么 了 可 以 被 一 个 单 带 的 时 间 复杂 度 为 O(T^ (n) ) 的 NDTM 接受 。 

证 明 ; 构造 一 个 时 间 复 杂 度 O( T^ (n) ) 的 单 带 NDTM M, 以 接受 上 ， 所 用 的 策略 是 把 M, 的 磁 
带 看 做 好 像 有 2“ 磁道 ”， 如 图 10-4 所 示 ， 也 就 是 说 ，M 的 磁带 符号 是 2k 元 组 ， 它 的 奇数 号 磁 
道 的 元 素来 自 了 的 符号 ， 偶 数 号 磁道 的 元 素 或 者 是 空白 b 或 者 是 一 个 特殊 的 标记 符号 #。 上 个 奇 
数 号 磁道 相应 于 M 的 个 磁带 ， 每 个 偶数 号 磁道 包含 除了 一 个 # 符 号 外 其 余 都 是 符号 b。 在 妇 磁 
道上 的 符号 # 标 记 以 在 j 磁 带 上 的 磁头 位 置 ， 它 对 应 于 多 -1 磁道。 在 图 10-4 中 我 们 已 经 表明 ， 
MET (o &jsk) ， 第 /个 磁头 扫描 第 7 个 磁带 的 5 单元 。 
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Tape 1 of M 
Head for tape 1 
Tape 2 of M 


Head for tape 2 
| 


| Tape kof M 
Head for tape k 

















图 10-4 MM 的 磁带 示意 图 


MM 模拟 M 的 一 次 移动 如 下 。 一 开始 ， 假 设 W, 的 磁头 是 在 包含 M 的 最 左 端 磁头 的 单元 上 。 

1. M, 的 磁头 向 右 移动 直到 它 经 过 偶数 号 磁道 上 的 所 有 上 大 个 磁头 标记 。 当 它 移动 时 ，M, 在 自 
已 的 状态 里 记录 M 的 每 个 磁头 扫描 的 符号 ; 

2. 在 第 1 步 中 M, 的 动作 是 确定 性 的 ， 现 在 M, 作 一 个 非 确 定性 的 “分 支 "。 具 体 地 , Æ MH 
状态 (这 个 状态 是 MM 已 经 在 自己 的 状态 里 记录 下 来 的 ) 和 MM 扫描 的 磁带 符号 (这 些 符号 是 M, 刚 确 
定 的) 的 基础 上 ，M, 不 确定 地 选择 M 的 一 个 合法 移动 。 对 M 在 这 种 情况 下 的 每 个 合法 的 移动 ， 
Mi 都 有 一 个 它 可 以 进入 的 下 一 个 状态 ; 

3. 已 经 选择 了 MM 的 一 个 移动 进行 模拟 ，M, 根据 选 择 的 移动 改变 M 的 状态 ， 这 个 状态 记录 在 
自己 的 状态 中 。 然 后 MM 向 左 移动 磁头 直到 它 再 次 经 过 上 个 磁头 标记 符 。 每 当 找 到 一 个 磁头 标记 
符 ， 和 选择 的 移动 一 致 ，M, 在 磁道 上 改变 磁带 符号 ， 且 向 左 或 向 右 移动 磁头 标记 至 多 一 格 。 

此 时 ，Mi 已 经 模拟 了 M 的 一 次 移动 。 因 为 磁头 至 多 在 它 的 左 端 磁头 标记 右 侧 两 格 处 ， 所 以 
标记 可 以 被 找到 ， 并 使 模拟 过 程 循环 重复 。 

BER M WRT MRS, WA, WMR MH 接受 ， 则 MW, 就 可 以 接受 。 如 果 M 接受 长 度 为 n 的 
字符 串 w， 则 它 用 一 个 不 多 于 7(n) 个 移动 的 序列 来 完成 接受 工作 。 很 明显 ， 一 个 包含 T(n) 个 移 
动 的 序列 里 ，M 的 磁头 不 可 能 到 达 多 于 T(n) 个 不 同 的 格 ， 所 以 MW, 能 够 用 自己 的 至 多 O(T(n)) 
个 移动 来 模拟 序列 的 一 个 移动 。 这 样 ，M, 通过 包含 至 多 O(T (n) ) 个 移动 的 序列 接受 w, KiE, 
M' 接 受 语言 .， 且 时 间 复 杂 度 是 0(T*(n))。 口 

推论 1 如 果 上 带 的 时 间 复 杂 度 T(n) 的 DTM 接受 L， 那 么 时 间 复 杂 度 为 0(T”(n) ) 的 单 带 
DTM HC L, 

证 明 : 在 上 面 的 证 明 中 ， 如 果 M 是 确定 型 的 ， 那 么 W, 也 是 确定 型 的 。 

推论 2 ”如 果 空 间 复杂 度 为 S(n) B9 kä NDTM HEL, 那么 一 一 定 存在 单 带 的 空间 复杂 朗 
S(n) 的 NDTM #252 L, 

推论 3 ”如 果 存 在 空间 复杂 度 为 SCn) 的 上 带 DTM 接受 上， 那么 一 定 存在 单 带 的 空间 复杂 度 
S(n) KIDTM 接受 了。 


10.2 多 类 和 .人 /FS 类 


现在 介绍 两 个 重要 的 语言 


定义 定义 天 TIME 是 所 有 语言 的 集合 ， 这 个 集合 中 的 每 一 语言 都 能 够 被 多 项 式 时间 复 杂 度 
的 DTM 所 接受 ， 也 就 是 说 : 


Z-TIME = {L| 存在 DTMM HSB AX p(n), 使 得 及 的 时 间 复 杂 度 为 p(n),， 且 L(M) =L}, 
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X X ARTIME 是 所 有 语言 的 集合 ， 这 个 集合 中 的 每 一 语言 能 够 被 多 项 式 时 间 复 杂 度 的 
NDTM 接受 。 经 常 将 ATIME 和 NATIME 分 别 简 写成 只 和 SP, 

首先 可 以 看 到 ， 尽 管 已 经 用 图 灵机 的 术语 给 出 邑 和 .MB 的 定义 ， 但 是 仍 可 以 使 用 其 他 计算 
模型 进行 定义 。 直 观 地 ， 可 以 把 多 看 做 是 在 多 项 式 时 间 内 可 识别 的 语言 类 。 例 如 ， 可 以 证 明 在 
对 数 代价 模型 下 ， 如 果 语 言 L 关 于 图 灵机 的 时 间 复 杂 度 为 T(n) ， 那 么 关于 RAM 或 RASP， 其 时 
间 复 杂 度 处 于 有 7T(n) 和 TT(n) 之 间 ， 其 中 和 为 正常 数 。 这 样 ， 以 对 数 代价 为 基准 ，L 能 够 
被 多 项 式 时 间 复 杂 度 的 图 灵机 所 接受 当 且 仅 当 工 在 RAM 或 RASP 上 有 和 多项式 时 间 的 算法 。 

还 可 以 定义 一 个 “ 非 确 定型 "的 RAM 或 RASP, 方法 是 添加 指令 CHOICE(L,, L, ---, L,) 8] 
RAM 或 RASP 的 指令 列表 里 ， 这 个 指令 使 得 标记 为 Ll ，L,，…，L 的 语句 中 的 一 个 语句 非 确 定 地 
选择 和 执行 ， 这 样 ， 也 能 够 在 对 数 代 价 基准 下 ， 用 多 项 式 时 间 界 的 非 确定 型 RAM 或 者 RASP E 
X APRN., 

因此 ， 可 以 想像 存在 一 个 非 确 定型 计算 机 ， 诸如 RAM 或 RASP ， 能 够 从 一 个 给 定 的 初始 TD 
开始 ， 进 行 许多 不 同 的 可 能 的 移动 序列 。 这 样 的 机 器 看 来 可 以 在 多 项 式 时 间 内 识别 许多 语言 ， 而 
这 些 语言 显然 是 不 能 在 多 项 式 时 间 内 为 确定 型 算法 所 识别 的 。 当 然 ， 在 任何 使 用 确定 型 机 器 D 
直接 模拟 非 确定 型 机 器 N 的 尝试 中 ， 由 于 D 必须 一 直 保 持 着 记录 NN 的 大 量 副本 ， 所 以 为 了 执行 
所 有 可 能 的 移动 序列 ，D 所 需要 的 时 间 比 IN 的 任何 一 个 副本 都 多 得 多 。 能 够 从 前 一 节 的 结果 得 
出 的 最 好 结论 是 : MR LBP PA, 那么 上 能 够 被 某 个 时 间 复 杂 度 I By DTM 所 接受 ,大 为 某 
AER, p HETA, kA pk L, 

另 一 方面 ， 目 前 还 没有 人 能 够 证 明 一 个 语言 在 .MB 多 中 而 不 在 史 中 。 也 就 是 说 ， 还 不 知道 P 
ERASE +, Ril, WEARER EA .A2 中 的 语言 一 样 “ 难 " 的， 在 这 种 意义 上 ， 如 
果 有 一 个 确定 的 多 项 式 时 间 界 的 算法 来 识别 这 些 语言 中 的 一 个 ， 就 能 够 找到 一 个 确定 的 多 项 式 
时 间 界 的 算法 来 识别 .MB 中 的 任何 语言 。 一 般 称 这 些 语言 是 NP 完全 的 ”。 

定义 WRIPP HEA mm 满足 如 下 条 件 ， 则 定义 是 非 确 定 的 多 项 式 时 间 完 全 的 (简称 
NP 完全 的 ) : 如 果 给 定 一 个 时 间 复 杂 度 T(n) zn 的 确定 型 算法 来 识别 L, RAR A0 P 
语 盲 L， 都 能 够 有 效 地 找到 一 个 时 间 复 杂 度 T(p,(n)) 的 确定 型 算法 来 识别 ， 这 里 p, 是 依赖 于 工 
的 多 项 式 。 一 般 称 上 是 可 归 约 到 忆 的 。 

证 明 语 言 ,是 NP 完全 的 方法 是 证 明 LEIP, BRA APREA LAU SAAR” 
Bl Ly o 

定义 WRA-ASRRHMARARAA RIM, CH FRRLENEA Bw 转换 成 字 
ERLE Hw, CwoALPYARYweLY, MEXBALASAXTHRA LIN, 

WR LTRS L, H 可 被 时 间 复 杂 度 T(n) 2n 的 确定 型 算法 4 所 接受 ， 那 么 能 够 确定 
输入 w 是 否 在 L 中 ， 先 使 用 MM 将 ww 转换 到 w。， 然后 使 用 算法 A 确定 oy REEL, PS, AFT w 
ETEL, WR ME p(n) NFR, 那么 1 wi <p( 1 w1 )。 于 是 ， 有 一 个 算法 确定 w ES 
在 L 中 ， 所 用 时 间 为 p(1 wl )+T wl ))<7T(2p(1 wl ))。 如 果 了 是 多 项 式 的 ( 即 纪 在 多 
中 )， 那 么 接受 工 的 算法 将 是 多 项 式 时 间 界 的 ， 所 以 虐 也 在 多 中 。 

事实 上 有 一 些 作者 给 出 如 下 的 “IL 是 NP 完全 ”的 定义 如 果 语 言 五 在 .MB 中 , 且 每 个 .MB 中 
的 语言 都 是 多 项 式 可 转换 到 LA, WKAR ,是 NP 完全 的 。 尽 管 不 知道 两 个 定义 下 的 NP 完全 
语言 类 是 和 否 不 同 ,但 是 这 个 定义 看 起 来 比 前 一 个 定义 更 严格 。 定 义 中 “ 归 约 ”的 含义 是 指 如 果 M, 
是 用 于 识别 NP 完全 语言 的、 确定 的 7T(n) 时 间 界 的 图 灵机 ， 那 么 .4 中 的 每 个 语言 都 能 够 在 
T(p(n) ) 时 间 内 被 确定 型 图 灵机 识别 (其 中 为 某 个 多 项 式 )， 该 图 灵机 可 把 Mo 作为 一 个 子 程序 
调用 0 次 或 多 次 。 定 义 “ 转 换 ”" 是 指 M, 只 用 一 次 ， 且 只 能 以 受 限 的 方式 调用 。 尽 管 我 们 应 该 采纳 
比较 宽泛 的 定义 ， 但 是 我 们 所 有 的 NP 完全 的 证 明 却 反映 了 比较 狭义 的 定义 。 
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关于 这 两 个 定义 ， 以 下 一 点 是 很 明显 的 : 如 果 有 一 个 确定 型 的 多 项 式 时 间 界 的 识别 LW 
E, RA .MB 中 的 所 有 语言 都 能 够 在 多 项 式 时 间 内 识别 。 这 样 ， 或 者 所 有 的 NP 完全 语言 都 在 多 
中 或 者 都 不 在 。 前 者 为 真 的 当 且 仅 当 P-A4F, WREKE, KERMAN SERRE OPH, 


10.3 语言 和 问题 


上 面 把 史 和 .MB 定义 为 语言 类 ， 原 因 是 双重 的 。 第 一 ， 它 简化 了 记 法 ; 第 二 ,许多 来 自 不 
同学 科 ( 如 图 论 和 数论 ) 的 问题 经 常 可 表示 成 语言 识别 问题 。 例 如 ， 考 虑 一 个 要 求 对 每 个 实例 回 
“yes” R no” 的 问题 。 可 以 把 问题 的 每 个 实例 编码 为 一 个 字符 串 ， 将 初始 问题 形式 化 为 一 个 语 
言 识 别 问 题 ， 这 样 欲 识别 的 语言 就 是 包含 所 有 回答 为 “yes” 的 问题 实例 的 字符 串 表 示 。 第 9 章 讨 
论 过 这 样 的 编码 技术 ， 那 里 使 用 语言 识别 的 术语 形式 化 表示 许多 模式 匹配 的 问题 。 由 于 一 个 问 
题 的 时 间 复 杂 度 可 能 依赖 于 所 使 用 的 编码 ， 我 们 必须 仔细 挑选 编码 的 方式 。 

为 了 使 问题 -语言 之 间 的 关系 更 明显 ， 在 此 定义 一 些 问题 的 公共 “标准 ”表示 。 特 别 是 可 以 
进行 以 下 假设 。 

i. 整数 用 十 进 制 数 表示 ; | 

2.n 个 顶点 的 图 用 整数 1，2，…，n 表示 图 中 的 顶点 ， 这 些 整数 用 十 进 制 编码 (如 假设 1)， 
WARG, LRR, RE i 和 忆 是 表示 边 的 顶点 对 的 十 进 制 表示 ; 

3. 带 个 命题 变量 的 布尔 表达 式 用 字符 串 表 示 ， 在 串 中 * 表示 “and”，+ 表 示 “or”,， 5 X 
示 “not”9 ， 整 数 1，2，…，m 表示 命题 变量 。* 有 时 可 以 省 略 ， 如 果 需 要 的 话 ， 可 以 使 用 括号 ; 

这 样 就 可 以 说 一 个 问题 是 在 多 或 .f 多 中 当 且 仅 当 该 问题 的 标准 编码 分 别 在 PRP HP, 

例 10. 3 ”考虑 关于 无 向 图 的 国 问题 。 图 6 的 k HEC 中 包含 个 顶点 的 完全 子 图 (在 完全 子 
图 中 ， 每 一 对 不 同 顶点 都 相连 一 条 边 ) 。 团 问题 是 指 : 给 定 图 C 和 整数 上 ，C 是 否 包含 一 个 上 团 ? 

对 于 图 10-5 中 的 图 C, 上 =3 时 的 团 问题 实例 可 以 用 如 下 字符 串 编码 : 

3(1, 2)(1, 4)(2, 3)(2, 4)(3, 4)(3, 5)(4, 5) 
第 一 个 整数 表示 & 的 值 ， 然 后 是 边 所 连接 的 顶点 对 ， 用 i 表示 顶点 v,， 即 ， 按 上 面 列 出 的 次 序 ， 
图 中 的 边 是 (vw, v). (4, %), 1, (sve 
表示 团 问 题 的 语言 L 是 如 下 形式 的 字符 串 集合 。 
k(i,, jG, ha) Gigs jn) 

满足 带 边 (i,, J) (1 <r<m) 的 图 有 一 个 k 团 。 也 可 以 使 用 其 他 语言 来 
表示 团 问 题 。 例 如 ， 常 数 可 能 要 求 跟 在 图 后 面 而 不 是 放 在 图 前 面 ， 或 者 用 
二 进 制 整数 代替 十 进 制 整数 。 然 而 ， 对 于 任何 两 个 这 样 的 语言 ， 应 该 存在 一 
个 多 项 式 p， 使 得 一 个 语言 中 表示 团 问 题 实 例 的 字符 串 w 能 够 在 时 间 
pC 1 wl ) 内 转换 成 其 他 语言 所 表示 的 同样 的 问题 实例 的 字符 串 。 这 样 ， 就 
判断 是 否 玫 或 .MB 中 的 成 员 而 言 ， 恰 当地 选择 表示 团 问 题 的 语言 并 不 重要 ， 
只 要 使 用 “标准 "形式 的 编码 即 可 。 LI 

PIE rp, —-SAB WA ERE XLPLBERE c" 猜测” 哪个 顶点 属于 完 
全 于 图 ， 然 后 在 OC ) 步 内 验证 这 些 顶 点 中 的 每 对 之 间 都 有 一 条 边 ， 这 里 mos AXAR 
是 团 问题 的 编码 长 度 。 因 为 个 顶点 的 所 有 子 集 可 以 被 机 器 的 独立 副本 并 行 
地 检查 ， 所 以 非 确 定型 图 灵机 的 “强大 ”在 此 很 明显 地 体现 出 来 了 。 对 于 图 10-5 中 的 无 向 图 ， 有 
三 个 3 团 , Biv, v, v}, 1v, 9, v4} Hs, v4, sho 


， 后 面 将 看 到 团 问题 是 NP 完全 的 。 目 前 为 止 ， 还 没有 在 确定 型 多 项 式 时 间 内 解决 团 问题 的 已 





O ”经 常用 作为”(c) 的 简写 。 如 果 a 只 包括 一 个 单个 的 文字 (变量 或 者 变量 的 补 变量 ) ， 那 么 括号 可 以 省 略 。 
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知 办 法 。 

例 10.4 布尔 表达 式 (P +p.) * p BARCO +2)3 表示 ， 这 里 整数 ; 表示 变量 户 。 考 虑 语 
BL, 上 包含 所 有 表示 可 满足 的 布尔 表达 式 的 字符 串 ( 串 中 变量 存在 某 个 0 - 1 赋值 使 表达 式 的 值 
为 1) AKEH L dk .MB 中 的 。 一 个 接受 工 的 非 确定 型 算法 通过 “猜想 " A PAAR 
一 组 满意 的 0 - 1 赋值 开始 ， 如 果 存 在 使 布尔 表达 式 值 为 1 的 变量 赋值 则 猜想 成 功 。 然 后 ， 用 每 
个 变量 的 值 (0 或 1) 去 替换 输入 串 中 的 对 应 变量 。 当 用 单个 符号 0 或 1 蔡 代 命题 变量 的 十 进 制 表 
示 时 ， 需 要 对 申 作 移 位 ， 然 后 计算 结果 表达 式 以 验证 其 值 是 否 为 1。 

可 以 使 用 分 解 算 法 进行 表达 式 的 计算 ， 在 和 表达 式 长 度 成 比例 的 时 间 内 完成 验证 ( 见 Aho 和 
Uilman[ 1972] ) 。 甚 至 ， 不 使 用 有 效 的 分 解 算法 ， 读 者 也 应 该 比较 容易 地 在 0(rw ) 步 内 计算 出 命 
题 的 值 ， 因 此 ， 存 在 多 项 式 时 间 复 杂 度 的 非 确定 型 图 灵机 接受 可 满足 的 布尔 表达 式 ， 这 样 ， 确 定 
布尔 表达 式 是 否 可 满足 的 问题 是 在 .MB 中 的 。 因 为 “猜测 "一 个 正确 的 解决 方案 实际 上 意味 着 并 
行 测 试 所 有 可 能 的 解决 方案 。 这 个 问题 将 被 证 明 是 NP 完全 的 。 口 

经 常会 对 优化 问题 感 兴趣 ， 如 在 图 中 寻找 最 大 子 团 。 许 多 这 样 的 问题 能 够 在 多 项 式 时 间 内 
转换 为 语言 识别 问题 。 例 如 ， 图 6 的 最 大 团 可 以 用 如 下 方法 找到 , Rn C 的 表示 长 度 ， 对 于 
从 1~n 的 每 个 k， 确 定 是 否 有 大 小 为 的 团 。 一 旦 确定 最 大 团 的 大 小 为 m， 就 逐个 地 删除 顶点 直 
到 移 走 顶点 % 会 破坏 所 有 余下 的 大 小 为 m 的 团 为 止 。 然 后 考虑 包含 所 有 C 中 和 vw 相 邻 的 顶点 构成 
的 子 图 G'， 递 归 地 调用 过 程 ， 找 到 6' 中 大 小 为 m -1 WRC, 的 一 个 最 大 团 就 是 C 加 上 顶点 v。 

证 明 用 上 面 的 方法 找到 最 大 团 的 时 间 是 ”和 + 的 多 项 式 函 数 的 问题 ， 留 给 读者 作为 练习 ， 其 
P, n 是 6 的 表示 长 度 , i 是 判断 6 中 是 否 有 大 小 为 大 的 团 所 用 的 时 间 。 

一 个 形 如 "为 某 个 命题 已 找到 最 大 的 天 使 得 P(E) 为 真 " 的 优化 问题 经 常 能 够 用 二 分 搜索 法 来 
解决 ( 见 4.3 节 ) ， 这 里 上 的 可 能 取 值 关于 问题 描述 长 度 ”是 指数 数量 级 的 。 如 果 PCR) 为 真 ， 意 
味 着 PCI) ARG <k, 大 在 0 和 o 之 间 取 值 ，* 为 常数 ) ， 那 么 使 得 PC) 为 真 的 最 大 的 上 能 够 用 二 
分 搜索 法 在 经 过 loge” = nloge 次 测试 命题 P(E) 后 找到 。 这 里 读者 再 次 需要 确信 上 的 最 优 值 能 够 在 
一 定时 间 内 找到 ， 这 个 时 间 是 n 和 确定 P(E) 值 的 最 大 时 间 的 多 项 式 函数 。 

这 里 把 优化 问题 留 给 聪明 的 读者 ， 后 面 只 考察 yes - no 判定 问题 。 


10.4 可 满足 性 问题 的 NP 完全 性 


我 们 能 够 证 明 一 个 问题 或 者 更 准确 地 说 ， 一 个 问题 的 语言 表示 LB NP 完全 的 。 需 要 证 明 两 
点 : 在 AP 中， 以 及 .PP 中 的 每 个 语言 是 多 项 式 可 转换 到 [的 。 因 为 非 确定 型 的 “能 力 ”， 证 明 
给 定 的 问题 是 .4 中 的 通常 比较 容易 。 例 10. 3 和 10. 4 就 是 这 一 步 的 典型 例子 。 最 大 的 困难 在 于 
证 明 NP 中 的 每 个 问题 是 多 项 式 可 转换 到 所 给 定 的 问题 的 。 然 而 一旦 证 明了 某 个 问题 [是 NP 
完全 的 ， 就 可 以 通过 证 明 一 个 新 的 问题 L 在 .4 多 中， 且 六 是 多 项 式 可 转换 到 上 上 ， 从 而 证 明 工 是 
NP 完全 的 。 

下 面 将 证 明 布 尔 表达 式 的 可 满足 性 问题 是 NP 完全 的 。 然 后 再 证 明 一 些 命题 演算 和 图 论 中 的 
基本 问题 是 NP 完全 的 ,证 明 是 通过 先 证 明 它 们 在 .4 中 ,然后 再 证 明 可 满足 性 问题 (或 者 一 些 
别 的 已 经 证 明 是 .422 完全 的 问题 ) 是 多 项 式 可 转换 到 它们 之 上 的 ， 从 而 证 明 这 些 问 题 是 PSE 
全 的 。 

阐述 无 向 图 上 一 些 重要 的 .4 完全 问题 时 需要 用 到 的 定义 如 下 。 

定义 X G-(V, 8 有) 表示 一 个 无 向 图 。 

1. C 的 项 点 覆盖 是 了 的 子 集 S, SCV, WE C 中 每 条 边 都 与 5 中 的 某 个 顶点 相关 联 。 

2. 6 的 哈密 顿 回路 是 包含 了 中 每 个 顶点 的 一 条 回路 。 

3. 如果 对 C 的 顶点 存在 一 组 称 为 “颜色 "的 整数 1，2，…, 大 的 赋值 ， 使 得 没有 两 个 相 邻 的 
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顶点 赋予 相同 颜色 ， 则 称 6 是 上 可 染色 的 。C 的 色彩 编号 是 指使 得 C 是 上 可 染色 的 最 小 的 整数 上 。 

下 面 是 后 文中 表示 关于 有 向 图 的 一 些 重要 的 NP 完全 问题 时 需要 用 到 的 定义 。 

定义 设 C=(Y, 鳌 ) 是 一 个 有 向 图 。 

1. 反馈 顶点 集合 (a feedback vertex set) 是 一 个 顶点 子 集 S，SSETY， 满 足 C 的 每 个 回路 都 包含 
S 中 的 顶点 。 

2. 反馈 边 集 合 (a feedback edge set) 是 一 个 边 的 子 集 F, FCE, HG 的 每 个 回路 都 包含 FH 
的 边 。 

3. 有 向 哈密 顿 回路 (a directed Hamilton circuit) 是 包含 了 的 每 个 顶点 的 回路 。 

定理 10.2 如 下 的 问题 是 .AP 中 的 

1. (可 满足 性 问题 ) 布尔 表达 式 是 可 满足 的 吗 ? 

2.( 团 问题 ) 无 向 图 是 否 存 在 大 小 为 上 的 团 ? 

3. (顶点 禾 盖 问题 ) 无 向 图 是 否 存 在 大 小 为 上 的 项 点 覆盖 ? 

4. (哈密 顿 回 路 问题 ) 无 向 图 是 否 存在 哈密 顿 回 路 ? 

5. (可 染色 性 问题 ) 无 向 图 是 大 可 染色 的 吗 ? 

6. (反馈 顶点 集 问题 ) 有 向 图 是 否 存在 包含 上 个 成 员 的 反馈 顶点 集 ? 

7. (反馈 边 集 问题 ) 有 向 图 是 否 存 在 包含 天 个 成 员 的 反馈 边 的 集合 ? 

8( 有 向 哈密 顿 回路 问题 ) 有 向 图 是 否 存在 有 向 的 哈密 顿 回 路 ? 

9. (集合 履 盖 问题 ) 给 定 一 个 集合 族 5,，5,，…，5,”， 是 否 存在 一 个 包含 个 集合 的 子 集 
合 族 5,，5,，…，5S,， 使 得 

us, = Us? 

10. (AHAAA) ”给 定 一 个 集合 族 5,，5,，…，5S,， 是 否 存在 包含 两 两 不 相交 的 子 集合 
族 的 集合 覆盖 ? 

证 明 ; 我 们 在 例 10.4 和 10.3 中 分 别 证 明了 问题 1 和 2 是 .MB 中 的 。 类 似 地 ， 每 一 个 其 他 问 
题 都 要 求 设 计 一 个 非 确定 型 多 项 式 时 间 界 的 图 灵机 (或 者 ， 如 果 读 者 喜欢 的 话 ， 可 以 要 求 设计 一 
个 非 确定 型 的 RAM 程序 ) ， 用 这 个 图 灵机 去 “猜测 ”一 个 解决 方案 并 验证 其 是 否 真正 地 解决 了 问 
题 。 细 节 留 作 练习 。 L1 

现在 证 明 .MB 中 的 每 个 语言 是 多 项 式 可 转换 到 可 满足 问题 上 ， 因 而 也 就 证 明了 布尔 表达 式 的 
可 满足 问题 是 NP 完全 问题 。 

定理 10.3 确定 布尔 表达 式 是 否 可 满足 的 问题 是 NP 完全 问题 。 

证 明 ; 已 经 知道 可 满足 性 问题 是 /中 的 。 这 样 只 需 证 明 .MAB 中 的 每 个 语言 世 是 多 项 式 可 转 
换 到 可 满足 性 问题 上 的 即 可 。 设 M 是 一 个 接受 工 的 ， 多 项 式 时 间 复 杂 度 的 非 确 定型 图 灵机 ，zw 
E M KARA. AMA w 可 以 构造 布尔 表达 式 we ， 使 得 w 是 可 满足 的 当 且 仅 当 1 接受 z。 证 
明 的 关键 在 于 说 明 对 每 个 M 都 存在 多 项 式 时 间 界 的 算法 从 布尔 表达 式 w 构造 出 w。 这 里 多 项 式 
依赖 于 机 器 M. 

根据 引 理 10. 1 ，-4 纪 中 的 每 个 语言 都 可 被 一 个 多 项 式 时 间 复 杂 度 的 非 确定 型 单 带 图 灵机 所 接 
受 。 这 样 ， 可 以 假设 NM 只 有 一 个 磁带 ， 且 MARS q, h, s q, KERGE X, X, e 
Xn Ri p(n) 表示 M 的 时 间 复 杂 度 。 

假设 M 的 输入 zw 的 长 度 为 n。 如 果 人 接受 w， 那 么 它 在 p(n) 个 移动 内 完成 。 这 样 ， 如 果 从 


, 


o WAM, i, e, LJ BIBOSPE S ERECTA IO, i 为 集合 元 素 的 十 进 制 (或 二 进 制 ) 整 数 表示 。 如 果 在 所 
ARG PH 个 元 素 ， 则 用 整数 / 表示 第 7 PCR, 
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Rw, We LAE—-TID FAQ, Q,, ^5, Q,, HPQ, AMMID, Q, FO, (1sixg), Q, E 
SEX ID, spln), 并 且 没 有 一 个 中 有 多 于 p(n) 个 磁带 单元 。 

下 面 构造 布尔 表达 式 wo 来 “模拟 "M 所 进入 的 一 个 ID 序列 。w。 中 变量 的 真 假 赋值 (1 表示 真 ， 
0 表示 假 ) 至 多 表示 j 的 一 个 ID 序列 ， 也 可 能 不 是 合法 的 序列 。 布 尔 表 达 式 w。 取 值 为 1 当 且 仅 
当 变 量 赋值 表示 一 个 导致 进入 接受 状态 的 ID 序列 0,，Q; ，…，Q@,。 人 也 就 是 说 ，to 可 满足 当 且 仅 
当 戏 接受 zw。 下 面 的 变量 是 用 在 w。 中 的 命题 变量 ， 其 特定 含义 如 下 。 

1. Cli, j, 3&1 当 且 仅 当 在 时 刻 ; 时 ，MM 的 输入 磁带 的 第 i 个 单元 包含 磁带 符号 XX， 这 里 1 
xixp(n),1xjm, HOxtsp(n); 

2.S(k, 1) J& 1 当 且 仅 当 在 时 刻 上 时 ，M 处 于 状态 g,, 这 里 1<k<s, HO<t<p(n); 

3. Hli, t) #1 当 且 仅 当 在 时 刻 : 时 ,磁头 正在 扫描 磁带 单元 i, 这 里 1<i<p(n), 且 0<t 
<p(n)o 

这 样 ， 有 0(p*(n) ) 个 命题 变量 ， 这 些 变量 能 够 用 至 多 coga 位 二 进 制 数 表示 (c 为 依赖 p 的 
常数 ) 。 在 下 面 很 容易 维持 这 样 一 个 假定 : 每 个 命题 变量 能 够 用 一 个 符号 而 不 是 clogn 个 符号 来 
表示 ， 去 掉 因子 clogn 不 会 影响 函数 是 否 多 项 式 时 间 界 的 问题 。 

用 这 些 命 题 变量 ， 我 们 将 根据 IDEA Q, ，Q ，…，0Q, 构 造 一 个 布尔 表达 式 w。。 在 构造 中 ， 
利用 谓词 U(x, , x,，…，x,) ， 该 谓词 在 其 参数 x, ，x,，…，x, 中 恰好 有 一 个 为 1 时 取 值 为 1。U 
能 够 表示 成 如 下 形式 的 布尔 表达 式 ， 

U(x, 3m) 《后 十 和 十 人 二) 和 二 为 )) (10-1) 


式 (10-1) 的 第 一 个 因子 保证 至 少 一 个 “为 1， 余 下 的 r(r -1)/2 个 因子 保证 了 没有 两 个 x, 同 时 为 1。 
注意 到 当 用 形式 化 方法 写 出 UU 时 ，U(x, ，x,，…，z, BEBE 0(7)9. 

如 果 MH uw, BRAB—A7 M EM w EAB ID ERFA: Q, Q, s Qo ATRAE 
ik, PRH, Bi M 已 经 修改 ， 使 得 无 论 何 时 它 到 达 接 受 状态 时 ， 可 以 继续 “运行 ”"， 但 
纸 不 会 移动 磁头 也 不 会 离开 接受 状态 ， 且 序列 中 的 每 个 ID 都 用 空格 延长 至 P(na) 。 因 此 ， 我 们 将 
wo 构造 为 下 面 七 个 表达 式 4，B，…，G 的 乘积 ， 以 保证 Qu, Q, cc, 0, E — 7 ERE ID 序列 ， 
这 里 每 个 Q; 的 长 度 为 P(n) 且 4=P(n)。 那 么 ， 断言“ 0,，Q ，…，Q ,是 接受 的 如 序列 ”和 如 下 
断言 等 价 : 

1. 在 每 个 ID 中 ， 磁 头 恰好 扫描 一 个 单元 ; 

2. 每 个 ID 在 每 个 磁带 单元 里 恰好 有 一 个 磁带 符号 ; 

3. 每 个 ID 恰好 有 一 个 状态 ; 

4. 从 一 个 了 D 到 下 一 个 ID， 至 多 有 一 个 磁带 单元 (磁头 扫描 的 单元 ) 被 修改 ; 

5. M 的 移动 函数 允许 连续 的 ID 在 状态 、 磁 头 位 置 和 磁带 单元 内 容 上 进行 改变 ; 

6. 第 一 个 ID 是 初始 了 D; 

7. 最 后 一 个 ID 中 的 状态 是 接受 状态 。 

现在 构造 对 应 上 面 语句 1 ~7 的 布尔 表达 式 4 ~ G。 

LABS: 在 每 个 时 间 单元 ,六 恰好 扫描 一 个 磁带 单元 。 用 4, 表示 在 时 刻 上 时 恰好 有 一 个 单 
元 被 扫描 ， 那 么 ，4 =4o4,…4,o ， 这 里 

A, = U(H(A,D ,HQ D ,-- ,H(p(n) ,D) 
当 缩 写 U 被 扩展 时 ，4 的 长 度 为 0(p'(n))， 且 能 够 在 该 时 刻 内 写 下 来 。 
2.8 断言 每 个 磁带 单元 在 每 个 时 刻 单元 恰好 包含 一 个 符号 。 用 B, 断 言 第 i 个 磁带 单元 在 时 


O “每 个 变量 使 用 一 个 符号 进行 标记 ， 严 格 地 说 ， 需 要 0( log), BEBE OC?) TS, 
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刻 上 恰好 包含 一 个 符号 。 则 
B = 工 2， 
这 里 
B, = UCCCi,1,t) CC 12,0) ,,CCi m,t)) 
因为 磁带 字母 表 的 大 小 m RARE LEL M, MARA B, 的 长 度 独 立 于 n。 这 样 ，B 的 长 度 
HÀ O(p (n)). 
3.C 断言 : 在 每 个 时 刻 :，MM 在 一 个 且 仅 在 一 个 状态 : 
C = II Uca. t) ,S(2,t) 7, S(5,0)) 


Oxtxp(n 


经 然 M 的 状态 数 * 是 一 个 常量 ， 那么 C 的 长 度 为 0(p(n))。 
4. DRA: 在 任何 时 刻 上 至 多 一 个 磁带 单元 的 内 容 能 够 改变 : 
万 = Hic. t) m C(i,j,t+1)) + HCGi,t) ]? 

KAC., j, 1) =C(i, j t+1)) € HCi, 断言 : 

a) 磁 头 在 时 刻 :扫描 单元 i, 或 者 

b) 在 :+1 ntj, 第 j 个 符号 在 单元 i 当 且 仅 当 在 1 时刻 它 在 单元 io. BRAM B 声称 磁头 在 
BIS] t 正 扫描 一 个 单元 且 单 元 i 仪 包 含 一 个 符号 ， 那么 在 时 间 c 磁头 或 者 正好 扫描 单元 i， 或 者 单 
元 i 的 内 容 在 时 间 i 不 作 改 变 。 当 二 用 相应 的 表达 式 替代 时 ，D 的 长 度 为 0(p*(n) ) 。 

S.EWrzi: M 的 每 个 后 继 ID 可 以 通过 M 的 移动 函数 8 允许 的 一 个 转换 从 前 一 个 ID 获得 。 

用 Ei 表示 如 下 断言 之 一 : 

a) 第 ;个 单元 在 时 刻 上 不 包含 符号 方 

b) 磁头 在 时 刻 ;不 在 扫描 单元 i; 

c) M ERA t PERS k; 或 者 

d) M 的 下 一 个 ID 通过 M 的 移动 函数 允许 的 转换 从 前 一 个 ID 获得 。 


则 
E = [JEn 

这 里 

Eg, 77 Cli, j, t) +7 H(i, 1) +7 S(k, t) + XHcG, jis t+1)S(k, 2 £1) H(ij, t+1)] 
这 里 1 的 取 值 范围 为 : 当 M 在 状态 9 扫描 符号 LNA RE. WRB, HEll, X) 
中 的 每 个 3 元 组 (9， 王 ，d) ， 有 一 个 【的 对 应 值 ， 其 中 妃 =X, 2,79, Md ÉL, SRRY GHI 
是 ;-1,，; 或 +1。 这 里 5 是 1 的 移动 函数 。 因 为 W 是 非 确 定性 的 ， 所 以 可 能 有 多 个 这 样 的 3 元 
组 (9, XX，d) ， 但 是 数量 是 有 限 的 。 这 样 E, EMALT n 且 长 度 有 限 的 表达 式 ， 因 此 , EKKE 
H 0(p (mn) )。 

6. F rz: elias 

= S(1,0) H(1,0) TI ci, ,0) I, cG, 1,0) 

这 里 S(1，0)7 表示 在 时 间 上 =0 BT, MERE > 4 是 所 选取 的 初始 状态 ; H(1, 0) 表示 在 时 间 上 
=0 时 ，W 正在 扫描 左 端的 磁带 单元 ; HU。。C(i, 六，0) 断 言 磁 带 的 前 = 个 单元 初始 化 为 包含 输 
AB w; Thee Ci, 1，0) 断 言 余 下 的 磁带 单元 初始 化 为 空白 单元 。 取 Z 为 空白 符号 ， 显 然 ， 
F BREED O(p(n)) 。 . 

7. CHA: M 最 终 进 入 最 后 状态 。 因 为 已 经 要 求 M 一 旦 到 达 最 后 状态 就 保持 在 最 后 状态 ， 
BUA C=S(s, p(n))。 取 9, 为 最 后 状态 。 





© 这 里 用 x=y 表示 xy +xy， 即 x KHAM yo 
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布尔 表达 式 w EREA ABCDEFG, WA wo 的 七 个 因子 都 需要 最 多 0(P (mn) ) 个 符号 ， 那 么 
wo 本 身 有 0(p (mn) ) 个 符号 。 因 为 一 直 把 命题 变量 看 做 单个 符号 ， 而 事实 上 它们 是 用 长 度 为 
O(log ”) 的 字符 串 表 示 ， 因 此 实际 上 | wl 的 界 是 O(p'(n)log mn) ， 反 过 来 它 又 受 限 于 enp (n) 
(其 中 c 为 某 个 常数 )。 这 样 ，w。 的 长 度 是 w 长 度 的 多 项 式 函 数 。 因 此 ， 很 明显 ， 给 定 w 和 多 项 
式 p，wo 能 够 在 和 与 其 长 度 成 比例 的 时 间 内 写 下 来 。 

给 定 一 个 接受 的 1D 序列 0,，0,，…，Q,， 能 够 容易 地 找到 一 组 0 和 1 赋值 给 命题 变量 
Cli, j, t), SCk, OI HG, t), HR wu WHA! AR, SERS wo 取 值 为 1 的 一 组 变量 赋 
值 ， 能 够 容易 地 找到 一 个 接受 的 ID 序列 。 这 样 ，w, 可 满足 当 且 仅 当 MM 接受 w。 

除了 要 求 M 接受 的 语言 在 .4 中 ,没有 对 上 做 任何 限制 。 因 此 ， 已 经 证 明了 任何 .4 中 的 
语言 可 多 项 式 转换 到 布尔 表达 式 的 可 满足 性 问题 ， 所 以 有 结论 : 可 满足 性 问题 是 NP 完全 的 。 口 

事实 上 定理 10. 3 中 的 证 明 涉及 到 的 内 容 比 定理 本 身 包 含 得 多 。 如 果 一 个 布尔 表达 式 是 文字 
和 的 乘积 ， 那 么 该 表达 式 是 合 取 范 式 (CNF) 。 这 里 对 于 某 个 变量 *， 文 字 是 x 或 者 ~ x。 例 如 ， 
(x, x) (x +", 8x, ) YE CNF 中 ， 而 xx + 入 则 不 在 。 在 定理 10. 3 中 构造 的 表达 式 实际 上 也 在 
CNF 中 ,我们 无 需 增 加 它 的 长 度 一 个 常数 倍 就 能 把 它 转换 到 CNF, 

推论 CNF 中 的 布尔 表达 式 的 可 满足 性 问题 是 NP 完全 的 。 

证 明 : 完全 可 以 证 明 ， 在 定理 10.3 的 证 明 中 定义 的 4，…，C 中 的 每 个 表达 式 已 经 在 CNF 
中 ， 或 者 能 够 通过 使 用 布尔 代数 运算 法 则 ， 不 用 增加 表达 式 的 长 度 多 于 一 个 常量 倍 将 其 改 为 CNF 
范式 。 在 公式 (10-1) 中 定义 的 U 已 经 在 CNF 中 ,因此 4, B 和 C 在 CNF h, BH FA GEYA 
文字 的 乘积 ， 所 以 下 和 G6 显然 在 CNF 中 。 

D 是 形式 为 (x 三 y) +: 的 表达 式 的 乘积 。 如 果 替 换 = 符 号 ， 则 可 得 表达 式 

Xy 十 MY +z (10-2) 
可 以 看 出 ， 表 达 式 (102) 等 价 于 
(xty+z)(x+y¥ 42) (10-3) 
用 式 (10-3 ) 替代 式 (1022) 在 D 中 的 所 有 出 现 ， 能 够 得 到 一 个 等 价 的 CNF 表达 式 ， 且 其 长 度 至 多 
两 倍 于 原 式 的 长 度 。 

Bia, RARE EREA ,的 乘积 ， 既 然 每 个 ,长度 的 界 独立 于 n， 那 么 每 个 5, 能 够 用 
长 度 独立 于 n 的 CNF 表示 。 这 样 ,，E 转换 到 CNF 将 至 多 在 长 度 上 增加 常数 倍 。 

由 此 ,已 经 证 明了 表达 式 w。 能 够 转化 为 CNF ， 且 得 到 的 CNF 的 长 度 也 只 是 比 原来 增加 了 常 
数 倍 。 

前 面 刚刚 证 明了 CNF 表达 式 的 可 满足 性 问题 是 NP 完全 的 ， 事 实 上 ， 既 使 在 很 严格 的 条 件 
下 ， 布 尔 表 达 式 的 可 满足 性 问题 仍 是 NP 完全 的 。 如 果 一 个 表达 式 是 至 多 个 文字 的 和 的 乘积 ， 
则 该 表达 式 称 为 在 上 合 取 范 式 (k -CNF) 中 。k 可 满足 问题 确定 是 否 上 -CNF 中 的 表达 式 可 满足 。 
对 于 上 =1 或 2， 能 够 找到 多 项 式 时 间 的 确定 算法 测试 可 满足 性 问题 ,而 当 =3 时 ， 正 如 下 面 
定理 所 描述 的 那样 ， 情 况 ( 可 以 预见 ) 发 生变 化 。 

定理 10.4 3 可 满足 性 问题 是 NP 完全 的 。 

证 明 : 我 们 将 证 明 CNF 表达 式 的 可 满足 性 可 多 项 式 转换 到 3 可 满足 性 。 给 定 一 个 和 的 乘 
积 , 用 

(tx tH) (tH tH) Kt event yu Xia) a + x, +Y) (10-4) 
替代 每 个 和 式 (z ex, + ox), KA, yu ys cns ER. Bl, HF k-4, HER 
(10-4) E(x, +x, +y,) (o, x, +y;,)o 

某 组 新 变量 的 赋值 使 得 替代 表达 式 的 值 为 1 当 且 仅 当 文 字 %,，x,，…， zx 中 有 一 个 值 为 1。 

也 就 是 说 ， 当 且 仅 当 初始 的 表达 式 值 为 1。 假 设 * =1， 那 么 当 j<i -2 时 ， 设 7 为 1; Mjoi-2, 
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设 y 为 0。 此 时 替代 表达 式 值 为 1。 反 之 ,假设 对 y, 的 某 组 赋值 使 得 结果 表达 式 值 为 1。 如 果 y, = 
0, 那么 x 或 者 x 必须 为 1。 如 果 y.,=1， 那 么 x,_! 或 者 % 值 必须 为 1。 如 果 y, =1 Hy, ,-0, 那 
人 么 对 于 某 个 i,， 1 <isk-4, y, 21 Hy, =0， 这 意味 着 % ,必须 为 1。 无 论 如 何 ， 必 须 有 一 个 入 
为 1。 

每 个 替代 表达 式 的 长 度 是 以 被 蔡 代 的 表达 式 的 长 度 的 常量 售 为 界 的 。 事 实 上 ， 给 定 任意 
CNF 表达 式 五 ， 通 过 对 每 个 和 式 运 用 上 面 的 转换 ， 能 够 找到 一 个 3 - CNF RARE, PETRE 
的 当 且 仅 当 初始 表达 式 是 可 满足 的 。 此 外 ， 由 于 转换 是 直接 应 用 的 ， 所 以 能 够 在 和 巨 的 长 度 成 
比例 的 时 间 内 找到 五 。 口 


10.5 其 他 NP 完全 问题 


通过 直接 或 间接 转换 可 满足 性 问题 到 定理 10.2 中 提 到 的 每 个 问题 ， 可 证 明 它们 也 是 NP 完 
全 的 。 图 10-6 的 树 结构 说 明了 实际 要 进行 的 转换 序列 。 在 图 10-6 rh, MRP BP MRA, XE 
人 么 证 明 己 可 多 项 式 转换 到 P’ 







3 可 满足 性 


有 向 图 的 
哈密 顿 回路 


图 10-6 各 种 难题 的 转换 顺序 


定理 10.5 CNF 可 满足 性 问题 可 多 项 式 转换 到 团 问 题 。 因 此 团 问题 是 NP 完全 的 。 

证 明 ; RFF FoF 是 CNF 中 的 表达 式 ， 其 中 合 取 因子 的 形式 为 (x + Xo + tan), 
其 中 x; 是 文字 。 下 面 将 构造 无 向 图 G=(V，E)， 它 的 顶点 是 整数 对 [i, 站 (1<i<g, 1<j<k,), 
整数 对 的 第 一 个 元 素 表 示 因 子 ， 第 二 个 元 素 表示 因子 中 的 文字 。 很 自然 ， 图 中 的 每 个 顶点 对 应 特 
定 因子 的 特定 文字 。 

G 的 边 是 顶点 对 ( [i, j], [k, 11), WB itk, x rx, A, UR, 门 和 [大 ， 中 对 应 不 同 
的 因子 ， 且 可 以 赋值 给 文字 x, 和 xi 中 的 变量 ， 使 得 两 个 文字 的 值 均 为 1( 即 给 FF. 和 下 赋值 为 1)， 则 
E C 中 它们 是 相 邻 的 。 也 就 是 说 ，x; =ru, 或 者 x; 和 x。 是 不 同 变量 的 求 补 形式 或 不 求 补 形式 。 

在 图 6 中 的 顶点 数量 明显 小 于 下 的 长 度 ， 边 的 数量 则 至 多 是 顶点 数 的 平方 。 这 样 ，C 能 够 
编码 为 一 个 串 ， 其 长 度 限 制 在 到 长 度 的 多 项 式 边界 内 。 更 重要 的 是 ， 这 样 一 个 编码 能 够 在 下 长 
度 的 多 项 式 边 界 时 间 内 计算 。 下 面 将 证 明 G 有 大 小 为 4 的 团 当 且 仅 当下 是 可 满足 的 。 因 此 ， 给 定 
一 个 团 问 题 的 多 项 式 时 间 界 的 算法 能 够 构造 一 个 CNF 可 满足 问题 的 多 项 式 时 间 算 法 ， 通 过 转换 
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表达 式 F 到 图 G, 使 得 G 有 大 小 为 4 的 团 当 生 仅 当下 是 可 满足 的 。 接 下 来 证 明 C 有 大 小 为 g 的 团 
当 且 仅 当 下 是 可 满足 的 。 

MC ”假设 下 是 可 满足 的 ， 那 么 存在 对 变量 的 0 -1 赋值 ， 使 得 =1。 对 于 这 个 赋值 ，F 的 每 
个 因子 值 为 1， 每 个 因子 FF 至 少 包含 一 个 值 为 1 的 文字 , 设 中 中 的 这 个 文字 为 xs 。 

可 以 宜 称 顶 点 集合 { [i,m,] | 1<i<g| 形 成 大 小 为 gq 的 团 。 否 则 存在 i 和 j(izj) ， 使 得 项 
点 [i，m,] 和 [j，m,] 之 间 没 有 边 。 根 据 G 的 边 集 定义 ， 这 意味 着 ta = zx。 。 但 是 根据 选择 x。 的 
方法 有 tmi xu, =1， 所 以 这 是 不 可 能 的 。 

仅 当 ”假设 6 有 大 小 为 4 的 团 ， 因 为 第 一 个 元 素 相同 的 两 个 顶点 没有 边 连接 ， 所 以 团 中 的 
每 个 顶点 的 第 一 个 元 素 肯定 不 同 。 因 为 图 中 恰好 有 Y 个 顶点 ， 则 团 的 顶点 和 下 的 因子 之 间 一 一 对 
应 。 设 团 的 顶点 是 [i, m], 1<i<g, S 2lylx,, sy, RB1<i<q, y 是 一 个 变量 | HS, = 
{yl xn =7， 这 里 1<i<g, y 是 一 个 变量 | 。 也 就 是 说 ，S, 和 5, 分 别 表 示 由 团 的 顶点 表示 的 不 求 
补 和 求 补 变量 的 集合 。 那 么 ，51n5, = 8， 否 则 在 [s，m,] 和 [1，m,] 之 间 将 有 一 条 边 ， 且 x。 = 
xw 。 通 过 设置 5 的 变量 为 1，5, 的 变量 为 0， 可 得 每 个 下 的 值 为 1。 这 样 ， 是 可 满足 的 。 O 

例 10.5 考虑 表达 式 下 = (y, ty) (n+) stn), HOCER 

Xu = Yifu = Ya = V3 


Xp = Y»X» = YX = Yi 


根据 定理 10. 5 构造 得 到 图 10-7。 如 图 所 示 ， 因 

为 [1，1] 和 [1，2] 的 第 一 个 元 素 相同 ， 所 以 没有 边 E (Ms 
连接 ， 又 因为 xu =y, Bx, =y, 所 以 [1, 1] 和 [3， MOT 

2] 之 间 没 有 连接 。[1，1] 连 接 到 图 中 其 他 三 个 顶点 。 A N 

有 有 三 个 因子 ， 在 图 10-7 中 碰巧 有 两 个 大 小 为 OwO o 
3 的 团 ， 即 和 1, 1], (2, 1), (3, 1]} 和 i[1, 2], ~ ~ 
[2, 2]，[3，2]} 。 在 第 一 种 情况 下 ， 表 示 为 三 个 
XFN, h, 7Y;， 这 些 变 量 都 没有 求 补 ， 且 团 相应 图 10-7 根据 定理 10.5 构造 的 图 
TH FEREN y =y, =y, =1。 另 一 个 团 则 相应 于 
使 F 为 1 的 另 一 个 赋值 ， 也 就 是 , y =y, =y =0。 口 

定理 10.6 团 问 题 可 多 项 式 转换 到 顶点 覆盖 问题 。 因 此 顶点 覆盖 问题 是 NP 完全 的 。 

证 明 : 给 定 无 向 图 C= (Y，P) ， 考 虑 C 的 补 图 G=(V, E), 这 里 EE=|(v, w) lv, weV, 
vžw, H(v, w) gE}。 集 合 SEV 是 G6 中 的 团 当 且 仅 当 Y- 3 是 6 的 顶点 覆盖 。 如 果 $ 是 GH 
Bl, fk 6 中 没有 边 连 接 S 中 的 两 个 顶点 。 这 样 ，6 中 的 每 条 边 都 至 少 附 着 在 了- $ 的 一 个 顶点 上 ， 
意味 着 了 -3 是 G 的 顶点 覆盖 。 类 似 地 ， 如 果 V-5 是 6 的 顶点 覆盖 ， 那么 G 中 的 每 条 边 至 少 附 
着 在 V-5 的 一 个 顶点 上 。 这 样 ，G 中 没有 边 连 接 5 中 的 两 个 顶点 。 因 此 5 中 的 每 对 顶点 均 有 C 
中 的 边 连 接 , 则 5 是 6 的 团 。 

为 了 弄 清 G 是 否 有 大 小 为 大 的 团 ， 可 构造 C， 确 定 是 否 它 有 大 小 为 上 Yi -上 的 顶点 覆盖 。 
如 果 确 实 有 ， 则 给 定 C = (V,，E) 和 上 的 标准 表示 ， 能 够 找到 G 和 上 Vi -大 的 一 个 表示 ， 且 所 需 
时 间 不 超过 G 和 上 的 表示 长 度 的 多 项 式 时 间 。 口 

例 10.6 图 10-8a 的 图 G 有 大 小 为 3 的 团 |1，2,，51 和 |1,，4, 5}, PH 10-86 中 的 CG 有 对 应 
大 小 为 2 的 顶点 覆盖 13, 41812, 31; G 有 大 小 为 2 的 团 |2,，31 和 [3, 41, C 上 有 对 应 的 大 小 
为 3 的 顶点 禾 盖 {1, 4, 51 和 {1, 2, 51. 口 
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Q) 
(5) (2) 
ob 


图 108 a) 图 6 b)G 的 补 图 GC 

定理 10.7 顶点 覆盖 问题 可 多 项 式 转换 到 反馈 顶点 集合 问题 。 因 此 ， 反 人 馈 顶 点 集合 问题 是 
NP 完全 的 。 

证 明 ; 设 6G=(V, EE) 是 一 个 无 向 图 ， 用 两 条 有 向 边 替 换 6 中 的 每 条 边 得 到 有 向 图 D。 具 体 地 ， 
Dz(V, E), RPE ={(v, w), (w, v)1 (v, w) eE}。 因 为 E 中 的 每 条 边 用 D 中 的 一 个 回路 代 
替 ， 所 以 集合 SSY 是 D 的 反馈 顶点 集 DD 的 每 个 回路 都 包含 5 中 的 一 个 顶点 ) 当 和 且 仅 当 5 是 C 的 顶 
点 和 覆盖， 而 且 很 容易 在 多 项 式 时 间 内 从 G 中 找到 D 的 表示 。 口 

定理 10.8 顶点 覆盖 问题 可 多 项 式 转 换 到 反馈 边 集合 问题 。 因 此 反馈 边 集合 问题 是 NP x 
全 的 。 

证 明 : 设 6G=(V,E) 是 无 向 图 ,，D = (Vx 10,1} ，E') 是 有 向 图 ， AP Era: 

1) 对 每 个 veV， 有 边 [v, 0] 一 [v, 1]9, B. 

2) 对 于 每 条 无 向 边 (v,，w) eE， 有 边 [v, 1][w, 0] 和 [w, 1][v, 0]。 

参阅 图 10-9。 





图 10-9 一 个 无 向 图 G 和 对 应 于 定理 10. 8 中 使 用 的 有 向 图 D 
顶点 覆盖 {2，41 相 应 于 反馈 边 集合 { (2, 0) 一 (2, 1), (4, 0) 一 (4, 1)1 


设 FCE' 是 DD 的 一 个 边 集 ， 对 DD 中 每 个 回路 ,该 集合 至 少 包含 回路 中 的 一 条 边 ， 用 边 [w， 
0] 一 Lw，1j] 代 震中 的 每 条 形式 为 [z，1] 一 [w, 0] 的 边 。 记 结果 集 为 F, WA F< 上 Fl， 
B 包含 每 个 回路 中 至 少 一 条 边 ( 出 自 [w,，0] 的 仅 有 边 指向 [w，1] ， 因 此 [w, 0] 一 [w，1] 是 在 
&s&[v, 1] 一 [w, 0] 的 任何 回路 中 )。 


O 为 了 提高 可 读 性 ， 这 里 和 本 章 的 后 续 部 分 ， 将 用 xy 表示 有 向 边 (x*，y)。 
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不 失 一 般 性 ， 假 设 对 某 个 人 ， 
F'zi[»,0]— [v,1]l 1 «i k} 

那么 对 某 个 i(1<i<k) 来 说 ,DD 的 每 个 回路 包含 边 [v,,0] 一 [v;,，1]。 然 而 ， 如 果 (x，y) 是 
G 中 的 边 ， 那 么 [x, 1], [y, 0], Cy, 1], [x, 0], [x, 1] 是 D 中 的 一 个 回路 。 这 样 6 的 每 条 
URME! E, Leisk, Kikin, n, co, v1 是 6 的 一 个 顶点 覆盖 。 

相反 ， 我 们 可 以 方便 地 证 明 给 定 大 小 为 的 顶点 覆盖 S$, 集合 {[v, 0] 一 [v, 1]! veS] ED 
的 反馈 边 集 合 。 为 了 确定 C 是否 有 大 小 为 的 顶点 覆盖 ， 可 以 在 多 项 式 时 间 内 构造 D， 且 决定 是 
否 九 包含 有 上 个 成 员 的 反馈 边 集合 。 o 

定理 10.9 顶点 覆盖 问题 可 多 项 式 转换 到 有 向 图 的 哈密 顿 回路 问题 。 因 此 有 向 图 的 哈密 上 顿 
回路 问题 是 NP 完全 的 。 

证 明 : 给 定 无 向 图 C=(V, FE) 和 整数 上， 下 面 说 明 怎 样 在 || V l| 的 多 项 式 时 间 内 构造 一 个 有 
向 图 G,-(V,, E), 118 Co 有 一 个 了 哈密 顿 回 路 当 且 仅 当 Y 的 大 顶点 集合 覆盖 C 的 边 。 

WV={o,, m, +, vl, He, RUM (o,, v)9, SIENTES a, a, --, a. CMA 
括 相应 于 每 个 ww 的 顶点 加 上 C 的 每 条 边 对 应 的 四 个 顶点 ， 更 精确 地 : 

V, = {a,,a,,:,a,} U l[v,e,b]I v e Vie e E,b e 10,1, 且 e 附 着 在 "上 | 

在 形式 化 描述 Co 的 边 之 前 ， 先 给 出 一 个 直观 解释 。 如 图 10-10 Bros, C 的 一 条 边 (w，w ) 用 

一 个 带 4 个 顶点 的 子 图 表示 。 


邻接 的 边 


Mi — 5v, 从 前 一 条 与 六 
邻接 的 边 





到 后 一 条 与 到 后 一 条 与 所 
邻接 的 边 邻接 的 边 


10-10 LO %) 的 表示 


如 果 一 条 哈密 顿 回路 从 A 进入 表示 边 6; 的 了 图， 那么 它 必须 从 D 离开 ， 原 因 在 于 ; 如 果 它 
从 C 离 开 ， 则 [we;,.0] 或 者 [s,，e,，1] 都 不 可 能 出 现在 回路 中 。 从 4 到 D， 路 径 可 以 访问 子 
图 中 的 所 有 四 个 项 点， 也 可 能 只 访问 左 端的 两 个 顶点 。 而 在 后 一 种 情况 下 ， 哈 密 顿 回路 必须 在 某 
RUA B 3l C 访问 右 端 的 两 个 顶点 。 

可 以 认为 Co 包含 V | 个 列表 ， 一 个 列表 对 应 一 个 顶点 。 顶 点 的 列表 包含 所 有 按照 特定 顺 
序 附着 在 "上 的 边 。 对 1 <j<#， 每 个 mw 有 一 条 到 顶点 [w，es，0] 的 边 ， 使 得 eu Ro FE E 
一 条 边 。 如 果 ,是 = 列表 的 最 后 一 条 边 ， 则 有 一 条 从 [w，e，1] 到 每 个 a 的 边 。 如 果 在 5 的 列表 
中 边 e, BUE 后 ， 则 有 一 条 边 从 [w，e ，1] 到 [w，e，0] 。 这 些 边 加 上 图 10-10 包含 的 边 形 
成 集合 Bo。 现在 证 明 Co 有 一 个 哈密 顿 回路 当 且 仅 当 C 有 覆盖 所 有 边 的 顶点 集合 。 

当 ”假设 顶点 2, n, e, op BER CUDA. Gy, fos = fa 是 附着 在 w 上 的 边 的 列表 


日 ”注意 es 和 6 表示 同一 条 边 ， 因 此 ， 认 为 有 着 相同 的 符号 。 
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(1<igk)。 考 虑 这 样 一 个 环 路 ， 从 顶点 w 到 [wm ， fa 0], [0s fus 11, Dm fos 01, Em, 
fos 11, 0s [ms fns 01, Uo, fao 11, BER a, Ble, fy, 0], [m fa, 11, 75, 等 
45, En, 4, e MADR, BeBe. ÉRTIREES 0, n, e, 4 的 顶点 相关 
WTS PAT Sb, XR TC, PRUE BUB TR. MA e ERRERA v, FAY, Isi 
bk， 那么 对 于 CMBMB Ml», e, 0], (v, e, 11G» 她 的 项 点， 可 以 扩展 上 述 的 环 ， 在 环 中 
用 路 径 

[we;0] ,[v,,e,0) ,[,,e,1],[v,,e,1] 

代替 从 [ww ，e，0] 到 [ww，e，1] 的 边 。 对 每 个 w 和 e 如 上 修改 的 回路 包含 Co 的 每 个 顶点 ， 因 
此 ， 是 一 个 哈密 顿 回路 。 , 

仅 当 ”假设 C* 有 一 个 哈密 顿 回 路 ， 则 环 路 能 够 拆 成 大 段 路 径 ， 每 条 路 径 从 顶点 a 开始 ， 在 
结 点 mw 结束。 通过 前 面 对 表 示 每 条 边 的 四 顶点 子 图 中 可 能 的 路 径 的 考虑 (如 图 10-10) ， 可 以 看 出 
存在 顶点 w， 使 得 从 a, 到 路 径 上 的 每 个 顶点 的 形式 为 [v，e, 0] 或 [v，e，1]， 其 中 e 是 C 中 的 
边 或 者 其 形式 为 [w，e，0] 或 [w，e，1] ， 其 中 e EX, w), ZE, EM a 到 a 的 路 径 上 的 每 
个 顶点 的 第 一 个 元 素 或 者 是 顶点 v, 或 者 是 和 vw 相 邻 的 顶点 。 对 于 从 a 到 a, 的 路 径 ， 可 以 使 边 和 
某 个 具体 的 顶点 v 相关 联 。 对 于 G6, 的 每 个 顶点 [w，e， b], e 一定 是 附着 在 和 G6 中 一 条 路 径 关 联 
的 上 顶点 中 的 一 个 顶点 上 。 这 样 ,，& 个 顶点 形成 6 的 一 个 顶点 覆盖 。 因 此 ，G。 有 一 个 哈密 顿 回路 
当日 仅 当 G6 中 存在 个 顶点 使 得 6 的 每 条 边 附着 在 这 上 个 顶点 的 一 个 顶点 上 。 口 





CD: 


b) 
图 10-11 带 哈密 顿 回路 的 图 a) 无 向 图 G b) 有 向 图 Co 

例 10.7 UL GARI», nMn Men, e es BER, a 10-11a 所 示 。 10-115 是 根 

据 定理 10.9 构造 的 图 G6, ， 图 中 粗 连 线 表 示 基 于 顶点 覆盖 1v,，v, | 的 Co 的 一 个 哈密 顿 回 路 。 口 


定理 10. 10 有 向 图 的 哈密 顿 回路 问题 可 多 项 式 转换 到 无 向 图 的 哈密 顿 回路 问题 。 因 此 确定 
无 向 图 中 有 和 否 哈 密 顿 回路 的 问题 是 NP 完全 的 。 
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R: WC (V, E) &— AU IER, U- (Vx 10, 1, 21, E) 是 一 个 无 向 图 ， 其 中 rE 
3 

1. 对 于 veV,，E' 有 边 ([v, 0], [v, 1]); 

2. 对 于 veV,，E' 有 边 ({v, 1], [v, 2]); 

3. M B. vow È E pA, EAW, 2], (w, 0])。 

注意 到 V 中 的 每 个 顶点 扩展 成 一 条 包含 三 个 顶点 的 路 径 ， 因 为 U 中 的 哈密 顿 回 路 必须 包括 
所 有 的 顶点 ， 所 以 回路 上 顶点 的 最 后 一 个 元 素 必 须 按照 0，1，2, 0，1，2，… 或 者 相反 的 顺序 
变化 。 可 以 假设 其 按 前 者 变化 ， 其 中 类 型 3 的 边 ， 其 第 二 个 元 素 从 2 变 到 0， 表示 6 中 的 有 向 哈 
密 顿 回路 。 反 之 ,通过 使 用 U 中 的 路 径 [v, 0], [v, 1], [v, 2], [w, ORRERA vw, W 
G 中 的 一 条 有 向 哈密 顿 回 路 可 以 转化 为 U 中 的 一 条 无 向 哈密 顿 回路 。 口 

定理 10. 11 顶点 覆盖 问题 可 多 项 式 转换 到 集合 覆盖 问题 。 因 此 ， 集 合 禾 盖 问 题 是 NP 完 
全 的 。 

证 明 : 设 C=(V, EE) 是 无 向 图 对 1<is | VI, 设 5, 是 附着 在 v, 上 的 所 有 边 的 集合 ， 很 显 
RW, Sas Sigs > Sa 是 5, 的 一 个 集合 覆盖 当 生 仅 当 | ，v,, ，…，w,| EC 的 一 个 顶点 覆盖 。 口 

定理 10. 12 3 可 满足 问题 可 多 项 式 转换 到 可 染色 问题 。 

证 明 : 给 定 3-CNF 中 的 带 n 个 变量 和 + 个 因子 的 表达 式 ， 证 明 如 何在 关于 Maln, 1) HS 
项 式 时 间 内 构造 带 3n +t 个 顶点 的 无 向 图 C = (VY，E) ,使 得 6 能 够 用 n+1 种 颜色 染色 当 且 仅 当 
严 是 可 满足 的 。 

Bex, Xa, 7, LAF, FL, +, FA FRAT, SIARAS v, n, e, 0,0 
因为 3 - CNF 中 带 3 个 或 更 少 变量 的 任何 表达 式 ， 能 够 在 表达 式 长 度 的 线性 时 间 内 直接 测试 其 可 
满足 性 ， 而 不 用 再 转换 到 可 染色 性 问题 来 检验 ， 因 此 不 失 一 般 性 ， 假 设 n>>4。G 中 包含 的 顶点 
如 下 ， 

1. x,, x Hl v,, isi<n, A 

2. F,, 1<i<t, 

G 中 包含 的 边 如 下 ; 

1. XT ij, RAHO, v); 

2. Fij, MAW, x), x); 

3. M I1sisn, W(x,, x); 

4. 如 果 x 不 是 因子 FR, WAH, F); 如 果 x 不 是 RAR, RI, F) o 

顶点 ww， 岂 ，…， 岂 形成 个 顶点 的 完全 子 图 ， 因 此 需要 n 种 不 同 的 颜色 。 每 个 和 % 均 连 
接 到 每 个 v,，izj， 因 此，%, 和 % 除 了 可 能 和 颜色 相同 之 外 ,不 可 能 和 其 他 v 顶点 有 同样 的 颜 
色 。 既 然 % 和 是 相 邻 的 ， 它 们 也 不 可 能 是 同一 种 颜色 。 所 以 ，G 不 可 能 用 n +1 种 颜色 染色 ， 
除非 % 和 % 的 一 个 和 颜色 相同 ， 而 另 一 个 是 一 种 新 的 颜色 ， 我 们 称 其 为 专 色 ( special color) 。 

考虑 将 或 5 中 对 应 染 成 专 色 的 那个 顶点 赋值 为 0。 现 在 考虑 赋 给 FAROE. FEDA 
2 个 x 和 % 顶 点 中 2n -3 个 顶点 相 邻 。 既 然 假 设 >4， 那 么 对 于 每 个 / 必 存 在 一 个 i， 使 得 下 与 
“和 % 都 相 邻 。 因 为 *, 或 x 的 一 个 是 用 专 色 染色 的 ，F 就 不 可 能 用 专 色 染 色 。 

如 果 下 包含 某 个 文字 y， 而 y 已 经 染 为 专 色 ,那么 已 就 不 能 和 任何 与 y 同色 的 顶点 相 邻 ， 因 
此 可 以 染 成 和 y 相同 的 颜色 。 否 则 ， 需 要 一 个 新 的 颜色 。 这 样 ， 所 有 的 严 顶 点 能 够 在 无 需 增加 颜 
色情 况 下 染色 当 且 仅 当 有 一 个 对 文字 的 专 色 赋 值 ， 使 得 每 个 因子 包含 某 个 文字 y, Hy RUS 
色 。 即 当 且 仅 当 能 够 给 变量 赋值 使 得 每 个 因子 包含 一 个 值 为 1 的 y(7 值 为 0) 。 也 可 以 说 ， 当 且 
仅 当 下 是 可 满足 的 。 口 
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例 10.8 设 下 是 (z 9x) (x, + 和 %)。 每 个 因子 包含 两 项 而 不 是 三 项 ， 这 个 变化 并 不 改变 定 
理 10.12 中 图 6 的 构造 ， 不 过 这 使 我 们 能 够 处 理 只 涉及 三 个 变量 的 表达 式 和 能 够 用 四 种 颜色 染色 
的 图 (注意 ， 类 似 定理 10. 12 对 2 - CNF 也 成 立 ， 但 这 不 是 我 们 感 兴趣 的 问题 。 因 为 对 于 2 -CNF 
的 可 满足 问题 ， 存 在 一 个 多 项 式 时 间 界 的 算法 进行 验证 ， 所 以 2 - CNF 的 可 满足 问题 是 多 项 式 时 
间 可 转换 到 这 里 每 个 问题 的 ) 。 结 果 如 图 10-12 所 示 ， 颜 色 标记 成 4，B，C 和 S( 专 色 ), 其 4 色 
方案 相应 于 变量 赋值 x =x, =x, =0。 口 





10-12 需要 4 色 染 色 的 图 


定理 10.13 可 染色 问题 可 多 项 式 转换 到 确切 覆盖 问题 ， 因 此 ， 确 切 巴 盖 问 题 是 NP 完 
全 的 。 
证 明 ; 设 G=(V, EE) 是 无 向 图 ,上 是 整数 ， 下 面 构造 集合 ， 集 合 的 元 素 从 5 中 选择 
S=VUi[e,iJlee EHI <is<k} 
对 每 个 veV 和 1<i<k， 定 义 
S, = {vt U {[e,i]1e 附 着 在 vz 上 } (10-5) 
对 每 条 边 e 和 1<i<k， 定 义 
Ta = i[e,i]l (10-6) 
下 面 将 图 6 BY k 染色 问题 关联 到 式 (10-5) 和 式 (10-6) 定 义 的 集合 的 确切 覆盖 问题 。 假 设 C Ak 
染色 方案 ， 其 中 顶点 bv 染色 成 c,， 这 里 c, 可 以 取 1 ~ 的 一 个 整数 ， 那 么 可 以 很 容易 地 检查 每 个 " 对 
应 的 集合 S.， 得 到 对 于 任何 的 v， 满 足 Le，i] eS。 的 单元 素 集合 7 形成 $ 的 一 个 确切 覆盖 。 在 证 
明 中 注意 到 ， 如 果 e = ("，2) 是 一 条 边 ， 那 么 zc， 因此 S, OSa = 名。 当然 ， 如 果 x My 不 相 
SB, Mj S, 和 S, 不 相交 ， 且 除非 7 和 所 有 其 他 被 选集 合 都 不 相交 ， 否 则 ， 不 选择 7.。 
反之 ,假设 集合 S 有 一 个 确切 覆盖 。 因 为 每 个 v 必须 正好 在 的 一 个 集合 中 ， 那 么 对 于 每 
个 vo， 就 有 唯一 的 c, 使 得 S, 在 乡 中 。 那 么 可 以 宣称 每 个 顶点 v 可 以 染色 c, 以 获得 C 的 上 染色 方 
案 ; 假设 不 是 ， 那 么 存在 某 条 边 e = (v,，w) ,使 得 c, =c, = c。 那 么 S。 RS. 都 包含 [e，c]， 这 
样 多 就 不 是 一 个 确切 覆盖 ， 与 假设 矛盾 。 口 


10.6 ”多项式 空间 界 问题 
还 有 另 一 个 普通 的 ， 包 含 了 .MB 难题 的 难题 类 ， 称 为 SPACE， 是 一 个 语言 类 ， 能 够 被 具 
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有 多 项 式 空 间 界 的 确定 型 图 灵机 所 接受 。 

回忆 一 下 ， 根 据 定理 10. 1， 如 果 工 能 被 一 个 空间 复杂 度 p( n) 的 NDTM 接受 (p 为 某 个 多 项 
式 ) ， 那 么 它 就 能 被 一 个 空间 复杂 度 p(n) 的 DTM BES, XH, ASPACE 也 包括 了 所 有 被 多 项 式 
空间 界 的 NDTM 接受 的 语言 。 因 为 每 个 多 项 式 时 间 边 界 的 NDTM 是 多 项 式 空间 界 的 ， 所 以 直接 
可 得 结论 /TIME CSPACE( 如 图 10-13)。 上 此外， 因为 FTIME CAPTIME CSPACE， 如 果 
Z-TIME = Z-SPACE, Ji) TIME =.ABPTIME， 所 以 不 可 能 出 现 SPACE 中 的 每 个 语言 有 确定 型 
HERRERA E IP-TIME 中 的 每 个 语言 有 确定 型 的 多 项 式 时 间 算法 更 不 可 能 。 

我 们 可 以 给 出 一 个 相当 普通 的 语言 L,， 它 是 玫 SPACE 完全 的 ， 也 就 是 说 , 了 在 SPACE H, 
如 果 给 定 一 个 7T(n) 时 间 界 的 确定 型 TM 接受 L,， 那 么 对 于 SPACE 中 的 每 个 语言 工 ， 能 够 找到 一 
^* T(p, (n) ) 时 间 界 的 确定 型 TM 接受 L， 这 里 的 p, 是 依赖 上 的 多 项 式 。 如 果 “ 确 定型 ” 换 成 “ 非 确定 
型 "， 结 论 同样 成 立 。 这 样 ， 如 果 工 在 -TIME H, 那么 TIME =.MPTIME = Z-SPACE ; 1038 L 
AP-TIME 中 , BBA AP-TIME = Z-SPACE, 语言 L, 是 补 集 非 空 的 正则 表达 式 的 集合 。 

引 理 10.2 设计 =(Q, T, 1, 8, b, qos q), 是 p(n) 空 间 界 的 单 带 DTM, p 是 某 个 多 项 
RK, 那么 存在 另 一 个 多 项 式 p'， 如 果 xeI"* 且 1 «cl =n, REPERE p'(n) 内 构造 正则 表达 式 
R,， 使 得 R, 的 补 为 空 集 当 且 仅 当 M 不 接受 x。 

证 明 : 证 明和 定理 10. 3 非常 相似 ， 那 里 使 用 布尔 函数 作为 描述 图 灵机 计算 的 语言 ， 这 里 则 
使 用 正则 表达 式 语 言 。 对 正则 表达 式 做 一 些 精 简 ， 能 够 用 正则 表达 式 表示 比 正 则 表达 式 本 身长 
得 多 的 关于 ID 序列 的 事实 。 

猪 想 正则 表达 式 R, 为 表示 M 不 接受 * 的 ID 序列 。 为 此 ， 使 用 字 
HRA=TU{[qX]| geQ EXET], Qx Th fER[oX] ZR M 
在 状态 9 时 ， 输 入 磁带 被 磁头 扫描 的 单元 符号 为 XY。 如 果 M 接受 xy， / 了 SPACE= WP sPACE 


那么 它 通过 一 个 移动 序列 完成 接受 操作 ， 在 这 个 序列 中 M 至 多 使 用 NP-TIME 
p(1x1) 个 磁带 单元 格 。 这 样 ， 可 以 用 长 度 正好 是 p(n) 的 符号 串 ws 





示 四 ,符号 串 中 除了 一 个 符号 之 外 ， 其 他 符号 都 来 自 7， 剩 下 的 符号 
形式 是 [ gqX] 。M BSA EPA BERE FI EB to, to, Hw E (E 1) 表示 ， 这 
里 # 是 一 个 新 的 分 隔 符 ， 每 个 w, 是 A' 中 的 一 个 字符 串 ， 表 示 一 个 ID， 图 10-13 空间 时 间 关 系 图 
| wi | =p(n)。 必 要 时 ,为 了 使 w 长 度 为 p(n)， 需 要 用 空格 填充 v, 

我 们 希望 构造 R,， 表 示 (AU [41 ) * 中 的 那些 字符 串 。 它 们 表示 人 在 输入 为 x 时 的 不 
接受 行为 。 这 样 RER (4U |#| ) * 中 的 所 有 字符 串 当 上 且 仅 当 打 不 接受 *x。 只 有 当 满 足 如 
下 的 四 个 条 件 中 的 一 个 或 多 个 时 ，(4U {#|+ ) * 中 的 字符 串 y 不 表示 M 的 一 个 接受 计算 。 假 
iix! =n, 

1. 对 于 某 个 上 1，y HERR Et fotow t, Rp, ERI i, 1<i<k, | wl =p(n), 
且 wi 中 除了 一 个 符号 ， 其 余 符 号 都 是 7 中 的 ， 而 其 余 符号 形式 是 [ GX); 

2. 初始 的 ID wi 是 错误 的 ， 也 就 是 说 ，y 不 是 以 #[ qua, l]a, -a bb bt, XE xa a 
且 空 白 的 数量 是 p(n) -n; 

3. M 从 不 进入 最 后 状态 ， 也 就 是 说 ， 没 有 形式 为 [gxX] 的 符号 出 现在 y 中 ，; 

4. y 有 两 个 连续 的 ID ， 第 二 个 ID 不 能 通过 M 的 一 次 移动 从 第 一 个 ID 得 到 。 

BUT A+B+C+DRARR,, RBA, --, DD 分 别 表示 以 上 条 件 1，…，4 所 定义 的 正则 表 
达 式 的 集合 。 

给 出 一 种 正则 表达 式 的 简写 方法 是 很 有 用 的 。 如 果 有 字母 表 S= ic,，c,,…, cul, HSH 
示 正 则 表达 式 c +c, + ten 另外， 使 用 5: 表 示 正 则 表达 式 ($) (3)…(S) (i 个 )， 也 就 是 说 ， 
用 $ 表示 字母 表 $ 上 的 长 为 ;的 字符 串 。 注 意 到 S 表示 的 正则 表达 式 的 长 度 是 2m - 1，8: 表 示 的 


n? 
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正则 表达 式 的 长 度 为 2m +1)。 类 似 地 ， 如 果 5, - 5, = {d,，d,，…，d,| ， 那 么 用 S$, -SERE 
则 表达 式 d, +d, +… +d,。 
基于 这 些 约定 ， 正 则 表达 式 A 能 够 写成 
AzA' «A IA" +A(A+#)° +(A4+#)°A 
+(A+#)#T° H(A C4)" 
+(A+#) SA (Qx )A' (Qx )A' 8CA & 40 
+ (A & 8) HA" AT CA 3)" 


+A, +A, tee +A nia (10-7) 
4 的 定义 将 在 下 文 给 出 ， 式 (10-7) 中 的 前 7 项 分 别 表 示 : 
1) 不 带 # 的 字符 串 ; 
2) 只 带 一 个 # 的 字符 串 ; 
3 ) 不 是 以 # 开 头 的 字符 串 ; 
4) 不 是 以 # 结 尾 的 字符 串 ; 
5) 在 两 个 # 之 间 没 有 Q xz 符号 的 字符 串 ; 


6) 在 两 个 # 之 间 包含 多 于 一 个 CQ xT 符 号 的 字符 串 ; 

7) 在 两 个 # 之 间 包 含 多 于 p(n) 个 4 符号 的 字符 串 。 

FP AULA, = (4+#)“ 反 #(4+#)” ， 所 有 的 4,; 并 在 一 起 表示 在 两 个 # 之 间 少 于 pP(n) 个 4 符 
号 的 字符 串 的 集合 。 

检查 式 (10-7) 的 正则 表达 式 是 否 确 实 表示 满足 条 件 1 的 字符 串 ， 留 给 读者 完成 。 注 意 到 前 6 
项 长 度 固定 ， 只 依赖 于 W; 第 7 项 的 长 度 明 显 是 0(p(n) ) 。 项 4; 长 度 为 OC), ATLA (10-7) Br 
有 项 4, 长 度 的 总 和 为 0(P (nz) ) ， 且 比例 常量 只 依赖 于 MM， 不 依赖 于 x。 此 外 ， 容 易 验 证 表达 式 
(10-7) 能 够 容易 地 在 n 的 多 项 式 时 间 内 写 下 来 。 

此 时 ， 注 意 对 于 B、C 和 DD， 只 需要 写 出 满足 条 件 2、3 或 4 但 不 满足 条 件 1 的 所 有 串 的 表达 
式 即 可 ， 也 就 是 说 ， 只 需要 产生 形式 为 #o1#…w,# 的 字符 串 ， 这 里 1 wl =p(n), HwiET'(Q 
xT)T 中。 然而 , 为 了 简化 问题 ， 这 里 将 写 出 表达 式 以 定义 满足 条 件 2、3 和 4 但 不 满足 条 件 1 
的 串 的 集合 ， 也 包括 满足 条 件 2、3 或 4 以 及 条 件 1 的 一 些 字符 串 。 因 为 根据 表达 式 4 的 定义 ， 
后 一 类 中 的 串 已 经 在 R. 中 ， 所 以 它们 在 8,，C 和 D 中 出 现 或 不 出 现 已 经 无 关 紧 要 了 。 

假设 输入 串 为 x =a,a,…a,， 将 8 表示 为 B, + B, +… + Bans 其 中 对 于 1<i<n 

B, -s(A-[q2,]) A" (A +#)* 

B, SA" (T - la,|) AV? (A + #) * 
对 于 n<i<p(n)， 

B, = SA (T- |b] AV? -i#(A +#)° 

这 样 ，B, 至 少 第 i 个 输入 符号 不 同 于 初始 DD。 很 明显 ，B 的 长 度 是 0(p*(n))， 比 例 常数 只 
依赖 于 M. 

把 C 写作 ((4+#) - Cla x7))"。 显 然 ， 这 个 表达 式 的 长 度 只 依赖 于 M. 

最 后 ， 按 如 下 方式 构造 D。 假 定 串 y ERMEER, CHER Atu twt wt, H 
中 对 每 个 i，1 wl =p(n), w, ÆA D wakit M 的 一 次 移动 得 到 的 下。 观察 给 定 y 的 任何 三 个 
连续 符号 ciczcs ， 能 够 唯一 地 确定 符号 ， 称 为 Keciczcs ) ， 它 一 定 在 c, 的 右边 出 现 p(n) +1 次 。 例 
jn, SAC, ，c 和 c 都 在 了 7 中 ,那么 c 在 下 一 个 耳 PH REAR, Mi f(c,c,.c,) =c,; fünf, 
在 7 中 ,cs =QxT 中 的 [gqX], HB8, X) = (p, X, L), RA ecc) =[pe,] EXS HRR 
规则 ， 包 括 : 或 在 Qx7 中 , 或 者 c 中 的 一 个 是 # 字 符 时 了 的 定义 ， 对 读者 来 说 这 应 该 是 很 显 
然 的 ， 留 作 练 习 。 
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因此 , DÆI AU [i PIA e. cL e, 项 Peiccs 的 和 ， 其 中 
Dc,c,c, = (A +#) ' ce, (A 8) Neee) (A E)" 
XB f(c,c,c,) =AU [f] - aee). RIAR D 的 长 度 是 0(p(n)), DERE O(p(n) ) 时 间 内 
写 下 来 ， 比 例 常量 只 依赖 于 M. 

这 样 ， 正 则 表达 式 R, 能 够 在 p'(n) 时 间 内 构造 ， 这 里 p' 是 p 数量 级 的 多 项 式 。 此 外 ，R, 表 示 
(AU [4 ) 当 且 仅 当 zx 不 被 MM 所 接受 。 口 

引 理 10. 2 构造 了 一 个 正则 表达 式 ， 它 的 字母 表 AU L8 的 大 小 依赖 于 NM。 我 们 希望 讨论 “ 补 
集 ( 关 于 它 的 字母 表 ) 是非 空 集合 的 正则 表达 式 的 语言 ”。 既 然 一 个 语言 一 定 有 一 个 有 穷 字 母 表 ， 
那么 可 在 一 个 任意 的 字母 表 于 上 对 一 个 正则 表达 式 进 行 如 下 编码 。 

L+, *, Ø, e 和 括号 直接 表示 自身 ; 

2. 字母 表达 的 第 i 个 符号 (以 任意 次 序 ) 表 示 为 #w#， 这 里 w 是 i 的 十 进 制 表示 。 

这 样 在 任何 的 字母 表 上 ， 只 要 17 个 符号 就 可 以 编码 任何 的 正则 表达 式 , Rr={+, n, 
OQ, €, (,), #, 0，1,，…，9| 是 这 个 字母 表 。 

定义 语言 L, ST' 是 正则 表达 式 R 的 编码 集合 ， 满 足 R 的 补 集 表示 一 个 非 空 集合 。 如 果 民 是 
字母 表 上 的 ， 那 么 补 集 也 是 关于 三 的 。 注 意 ， 如 果 RR 的 长 度 n>2， 那 么 它 的 编码 长 度 至 多 为 
3n log no 

引 理 10.3 L XE SPACE rp, 

证 明 ; 根据 定理 10.1， 可 以 构造 一 个 多 项 式 空 间 界 的 NDTM M 来 接受 L,。 设 RR 是 一 个 正则 
表达 式 ， 它 的 编码 作为 输入 字符 串 提 供给 W。 根 据 定理 9.2， 给 定 长 度 为 ”的 正则 表达 式 ， 构 造 
一 个 非 确定 的 、 有 至 多 2n 个 状态 的 有 穷 自 动机 4，4 接受 正则 表达 式 表 示 的 语言 。NDTMM 首先 
根据 提供 给 M B) R 的 编码 建立 自动 机 4。 注 意 在 定理 9. 2 的 构造 中 ,4 的 状态 转移 函数 能 够 在 不 
多 于 0(m) 的 时 间 内 构造 。 

假设 R 所 表示 集合 的 补 集 不 空 ， 那 么 存在 一 个 字符 串 x = a,…a,， 而 x 不 在 RR 表示 的 语言 
里 ，M 可 以 一 个 符号 一 个 符号 地 猜 出 xo M 使 用 2n 位 的 数组 保持 跟踪 记录 状态 集 5,，5, 是 4 在 读 
和 aa，m，…，ai(1<i 和 mm) 后 可 能 处 于 的 状态 集 。 开 始 ，$ 是 从 4 的 初始 状态 仅 通 过 e 转换 可 
到 达 的 状态 集 ， 在 M 已 经 猜测 了 a, as, ，…，ei; 之 后 ,4 将 处 在 某 个 状态 集 Sí PV 4 M 猜测 下 一 
个 输入 符号 wm 时 ， 它 首先 计算 Tu is 1s eo,(s, ai,1) 和 seS,| ， 这 里 8 是 4 的 状态 转移 函 
数 ; 然后 对 7 ,, 中 的 每 个 ,将 6,(s'，e) 中 的 每 个 状态 加 到 7.,, UHE S, (注意 这 和 算法 9.1 
类 似 ) 。 

当 猜测 a,a,…a, 时 ， 它 将 确定 $, 没 有 包含 4 的 最 后 状态 。 在 找到 一 个 没有 最 后 状态 的 状 
SAN, M 接受 它 自 己 的 输入 串 ， 即 正则 表达 式 R 的 编码 。 这 样 ，M 接受 只 的 编码 当 且 仅 当 及 
表示 的 集合 的 补 非 空 。 口 

现在 能 够 证 明 ， 如 果 正 则 表达 式 所 表示 集合 的 补 非 空 ， 那 么 其 编码 组 成 的 语言 二 是 多 项 式 
空间 完全 的 。 

定理 10. 14 UR LER ELS dX T(n) 2n 的 DTM 接受 ， 那 么 对 于 每 个 也 E 2 史 -SPACE， 有 
一 个 多 项 式 p,， 使 得 上 在 T(p,(n)) 时 间 内 被 接受 。 

证 明 : UEM RS LB DTM, 根据 引 理 10.2 和 如 下 讨论 ， 可知 有 一 个 多 项 式 时 间 界 (如 : 
时 间 复 杂 度 为 p, (n) ) 的 算法 可 以 从 输入 串 x 构造 正则 表达 式 R,。R, 定 义 在 圈定 的 17 符号 的 字母 
X b. 长度 一 定 不 超过 p,( | x1)。 根 据 引 理 10.2，R, 的 补 集 为 空当 有 旦 仅 当 x 在 亏 中 。 根 据 假设 ， 
我 们 能 够 在 T(1R,1) =7(pi( | x1) PRAM R 的 补 集 是 否 空 集 。 因 此 ， 构 造 R, 的 总 时 间 是 
pi( 1 x1), 测试 R. 的 时 间 是 T(p,( | x1))。 因 为 T(n) mn， 所 以 选择 mm (n) =2p,(n) 足 以 证 明 
定理 。 口 
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推论 L YE Z-TIME H, 4124 A-TIME = SPACE, 

A: WMR A-TIME = 家 SPACE， 那 么 根据 引 理 10.3, L, EATIME 中 。 反 之 , WUN Tn) 
作为 多 项 式 从 定理 10. 14 得 到 。 口 

定理 10. 15 wR LRL 8L M AE T(n) 2n 的 NTM & €, WA MFR Le SPACE, 4 
一 个 多 项 式 p, 使 得 上 在 时 间 T(p,(n)) 内 被 一 个 NDTM 所 接受 。 

证 明 ; 证 明 类 似 于 定理 10. 14。 口 

推论 元 在 .APTIME 中 当 且 仅 当 .MPTIME = Z-SPACE, 


试 给 出 图 10-1 中 NDTM 对 输入 10101 的 所 有 的 合法 移动 序列 ， 判 断 NDTM 是 否 接受 这 个 
输入 。 

试 非 形式 化 描述 接受 如 下 字符 串 集合 的 NDTM 或 非 确定 型 简化 ALCOL 程序 。 
a)10"10"…10" 的 字符 串 集 合 使 得 对 1<r<s 大 5， 有 =i; 

b)acy 的 字符 串 集合 使 得 x 和 7y 在 te， 外 "中 , 且 * 是 y 的 子 串 ; 

c) 和 (b) 一 样 , 但 x 是 y 的 一 个 子 序列 。 

试 描述 一 个 模拟 非 确定 型 RAM 程序 的 RAM 程序 。 

WEM 0 A1 A mxn EE, AAE ALGOL 程序 ， 求 M 的 最 小 的 * xzn 子 矩阵 S, 
TUR MM[i, 门 =1， 那 么 对 于 某 个 1<k<s， 有 S[k, 站 =1， 并 分 析 程 序 的 时 间 复 杂 度 。 
非 形式 化 地 描述 一 个 DTM， 在 其 某 条 磁带 的 适当 位 置 上 放置 一 个 标记 符 ， 证 明 如 下 的 函 
数 是 空间 可 构造 的 。 

a) n? 

b)n’ -n +1 

c) 2° 

d) n! 

试 证 明 : 如 果 一 个 空间 复杂 度 为 S(n) 的 单 带 NDTM 有 s 个 状态 和 :个 磁带 符号 ， 且 接受 
KEA n 的 单词 ， 那 么 它 在 一 个 至 多 包含 sS(n)s*" 步 移动 的 序列 内 接受 这 个 单词 。 
试 说 明 怎样 在 0(n) 时 间 内 ， 对 RAM 计算 一 个 布尔 表达 式 。 

试 证 明 由 不 是 重 言 式 的 布尔 函数 ?组 成 的 语言 是 NP 完全 的 。 

试 证 明子 图 同 构 问题 (判断 给 定 的 无 向 图 C 是 否 和 给 定 的 无 向 图 6' 的 某 个 子 图 同 构 ) 是 
NP 完全 的 [提示 ; 使 用 团 问题 或 者 哈密 顿 回路 问题 是 NP 完全 的 事实 ] 。 

试 证 明 背 包 问题 (给 定 整数 序列 S =i, i, o, LARS k, ETE STI, ae 
Siz hk?) SL NP 完全 的 [提示 : 可 以 使 用 确切 覆盖 问题 是 NP 完全 的 事实 ] 。 

试 证 明 分 割 问题 (习题 10. 10 中 Xj 72k 的 背包 问题 ) 是 NP 完全 的 。 

试 证 明 旅 行商 问题 (给 定 边 为 整数 权 值 的 图 GE， 寻找 一 个 回路 ， 它 包括 所 有 的 顶点 ， 且 边 
的 权 值 之 和 至 多 为 〖) 是 NP 完全 的 。 

试 证 明确 定 不 含 * 的 正则 表达 式 ( 即 只 用 运算 符 + 和， ) 是 否 不 能 表示 某 个 固定 长 度 的 所 
有 字符 串 的 问题 是 NP 完全 的 [提示 : 可 以 使 用 转换 CNF 可 满足 问题 到 正则 表达 式 问题 ] 。 
试 证 明确 定 一 个 字母 表 10} 上 的 正则 表达 式 是 否 不 表示 0 * 的 问题 是 NP 完全 的 。 

设 G=(V, 8) 是 一 个 无 向 图 ，v, 和 vw, 是 两 个 不 同 的 顶点 ，v, 和 的 一 个 割 集 ( cutset) 是 一 
个 子 集 SCE, 使 得 v 和 vw, 之 间 的 每 条 路 径 都 包含 5 的 一 个 元 素 。 试 证 明确 定 是 否 一 个 图 








O 重 言 式 是 对 于 变量 的 所 有 取 值 ， 其 值 均 为 1 的 布尔 表达 式 。 
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4i — RON. vi A vs BANA k IE, ER A A A Tn TF) NP 完 
全 的 。 


一 维 背 包 放 置 问题 如 下 。G = (TY， 巨 ) 是 一 个 无 向 图 , 大 是 一 个 正 整 数 ， 是 否 存在 一 个 了 
的 序列 Uy, 9, "n, v, (EG 


> li-jisk 
(es) eB 


试 证 明 这 个 问题 是 NP 完全 的 。 

试 证 明 ， 即 使 限制 为 3， 顶 点 的 最 大 度数 限制 为 4， 可 染色 问题 依然 是 NP 完全 的 。 

试 证 明 对 于 平面 图 习题 10. 17 的 结论 。[ 提示 : 先 证 明 仅 当 v 和 wv AE, nAn AER, 
图 10-14 的 平面 图 才能 用 3 色 染 色 。 将 这 个 结论 和 习题 10. 17 的 证 明 结合 起 来 。] 

试 通过 直接 表示 NDTM 的 计算 而 不 是 使 用 来 自 3-CNF 可 满足 问题 的 转换 来 证 明 团 问题 是 
NP 完全 的 。 


图 10-14 . 图 10-15 


考虑 有 两 个 指定 顶点 s 和 上 的 有 向 图 ， 每 条 边 有 一 个 整数 “容量 ”， 可 以 通过 反复 寻找 一 
条 从 :到 :的 路 径 ， 并 在 边 容量 所 允许 的 最 大 值 范围 内 沿 着 路 径 增加 流量 ， 从 而 构造 最 
大 流量 图 。 试 证 明 找 到 路 径 的 最 小 集合 ， 在 其 上 增加 流量 的 问题 是 NP 完全 的 [提示 : 考 
虑 如 图 10-15 形式 的 图 ， 将 问题 和 背包 问题 关联 ] 。 

相等 执行 时 间 的 调度 问题 描述 如 下 。 给 定 作 业 集 ST 1 几 ，…， 了 1， 时 间 限 制 上 +， 多 个 处 
Wap, AS 上 的 偏 序 < ， 是 否 存 在 至 多 需要 i 个 时 间 单 元 的 S 的 调度 ， 即 一 个 从 S 到 
由 ，2，…， 寻 的 映射 使 得 至 多 PP 个 作业 映射 到 同一 个 整数 上 ， 如 果 J< 了 7， 则 有 .AIJ) < 
ST)? 证 明 这 个 问题 是 NP 完全 的 。 

试 证 明 列 在 定理 10. 2 中 的 问题 是 .MP-TIME 的 。 

设 p,(x) 和 p,(x) 是 多 项 式 , 试 证 明 存在 一 个 多 项 式 ， 其 对 所 有 x 的 值 都 大 于 p (p, (zx) )。 
WRC, x) =i, Xa, 上 )，(gs，X,，R)1， 请 写 出 定理 10.3 证 明 中 的 EL, 

试 给 出 一 个 测试 2 可 满足 问题 的 多 项 式 算 法 。 

已 经 知道 图 同 构 问题 的 一 些 子 间 题 如 平面 图 的 同 构 问题 ， 是 比较 容易 处 理 的 ， 而 其 他 子 
问题 和 一 般 的 图 同 构 问 题 处 理 难 度 是 一 样 的 。 试 证 明 对 于 带 根 的 有 向 无 回路 图 的 同 构 问 
题 和 任意 图 的 同 构 问 题 是 一 样 复杂 的 。 

上 下 文敏 感 语 言 是 一 个 可 被 空间 复杂 度 为 n+1l 的 NDTM 接受 的 语言 (叫做 线性 界 自动 机 
(linear-bounded automaton) ， 见 Hopcroft 和 Ullman [ 1969] ) 。 试 证 明确 定 给 定 的 线性 界 自 
动机 是 否 接受 给 定 的 输入 问题 是 多 项 式 空间 完全 的 ， 也 就 是 说 ， 判 断 一 个 字符 串 是 否 属 
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于 上 下 文敏 感 语言 的 问题 是 P-SPACE 完全 的 。 
10.28 ” 试 证 明确 定 两 个 正则 表达 式 是 否 等 价 的 问题 是 多 项 式 空间 完全 的 。 
**10.29 ”描述 一 个 算法 接受 L，L, 是 正则 表达 式 R 的 编码 集合 ， 其 中 R 是 能 够 被 一 个 空间 为 线性 
界 的 DTM 所 实现 的 非 空 集合 。 


研究 性 问题 


10.30 显然， 一 个 公开 的 问题 是 否 -TIME = JP-TIME 或 .ATIME = -SPACE。 考 虚 到 已 有 的 
寻找 NP 完全 问题 的 多 项 式 时 间 算 法 的 大 量 工作 ， 这 个 问题 至 少 是 和 一 些 经 典 的 数学 问 
题 如 费 马 猜想 (在 对 于 n 23. 的 整数 范围 内 ，x" y" =z 是 否 可 解 ?) 或 四 色 问 题 等 一 样 
困难 。 

10.31 如 果 不 能 解决 习题 10. 30 中 的 问题 ， 则 还 有 一 点 更 令 人 感 兴趣 是 得 到 一 个 非 平凡 的 函数 
T(n), (843 AP-TIME 中 的 每 个 语言 的 (确定 型 ) 时 间 复 杂 度 为 7(n)。 目 前 ， 甚 至 T(n) 
=2 的 情况 还 没有 被 证 明 。 


文献 与 注释 


Hopcroft 和 Ullman[ 1969 ] 给 出 了 关于 非 确定 的 图 灵机 更 多 的 信息 。 定 理 10. 1 将 确定 型 和 非 
确定 型 TM 的 空间 复杂 度 相关 联 ， 这 是 Savitch[ 1970 ] 的 研究 结果 。 

可 满足 性 问题 是 NP 完全 的 关键 理论 是 Cook 提出 的 [1971b] Karp[ 1972] 列举 了 大 量 典 型 的 
NP 完全 问题 ， 他 给 出 了 这 一 概念 的 重要 性 的 清晰 说 明 。 从 那 时 起 ,许多 科学 家 不 断 添加 、 扩 充 
已 有 的 NP 完全 问题 族 ， 如 : Sahni[ 1972] , Sethi[ 1973], Ullman[ 1973], Rounds[ 1973] , Ibarra 和 
Sahni[ 1973], Hunt 和 Rosenkrantz [ 1974], Garey, Johnson 和 Stockmeyer[ 1974 ] , Bruno 和 Sethi 
[1974] 等 等 。 令 人 感 兴趣 的 是 在 Cook 的 开创 性 论文 之 前 ， 有 几 位 学 者 证 明了 一 些 NP 完全 问题 
是 多 项 式 相关 的 ， 但 没有 认识 到 此 类 问题 的 范围 。 例 如 ，Dantzig Blattner 和 Rao[ 1966 | 等 人 用 负 
的 权 值 把 旅行 商 问 题 与 最 短路 径 问题 相关 联 ;，Divetti 和 Grasselli[ 1968 ] 证 明了 集合 覆盖 问题 和 反 
馈 边 集合 问题 的 关系 。 

Meyer 和 Stockmeyer[ 1972 ] 首先 考虑 了 ASPACE 完全 问题 。Savitch[ 1971] 的 研究 结果 提示 了 
第 一 种 空间 完全 语言 的 存在 ， 该 论文 定义 了 一 种 log n 空间 完全 的 语言 (可 解 迷 富 的 集合 ) Jones 
[1973 | 和 Stockmeyer 与 Meyer( 1973 ] 论述 了 某 种 限制 形式 的 问题 间 的 多 项 式 时 间 可 归 约 性 。Book 
[1972 和 1974] 证 明了 某 些 复杂 问题 类 是 不 相 容 的 。 

习题 10.8 和 10. 9 来 自 于 Cook[ 1971b ] 的 研究 结果 ， 习 题 10. 10 ~ 10. 12 来 自 于 Karp[ 1972] 
的 研究 结果 ， 习 题 10. 13 来 自 Stockmeyer 和 Meyer[ 1973] 以 及 Hunt[ 1973a] ， 习 题 10. 14 和 10. 28 
来 自 于 Stockmeyer 和 Meyer [ 1973], ， 习 题 10.15 ~ 10. 18 来 自 于 Garey, Johnson 和 Stockmeyer 
[1974], Æ 10-14 根据 M. Fischer 的 建议 做 了 一 些 改 进 。 平 面 3 可 染色 问题 是 NP 完全 的 证 明 出 自 
Stockmeyer[ 1973] ， 习 题 10.20 来 自 Even[ 1973], ， 习 题 10. 21 来 自 Ullman[ 1973] ， 习 题 10. 25 来 
自 Cook[1971b], ， 习 题 10. 27 需要 完成 的 推导 来 自 Kamp[1972]。S$. Even 给 出 了 关于 如 何 证 明 
定理 10. 13 的 建议 。 








第 11 章 一些 可 证 难 的 问题 


本 章 将 证 明 两 类 扩展 正则 表达 式 的 补 的 空 性 问题 是 难 解 的 ， 即 任何 解决 上 述 问题 的 算法 至 
少 需 要 指数 阶 的 时 间 。 对 其 中 的 一 类 ， 本 章 给 出 一 个 实质 上 比 指数 阶 大 的 下 界 。 我 们 将 特别 说 明 
该 问题 需要 的 时 间 多 于 
y 
22 
其 中 2 的 个 数 是 有 穷 的 。 在 证 明 下 界 之 前 ， 先 考虑 表示 “允许 计算 进行 的 时 间 和 占用 的 空间 越 
多 ， 则 其 能 识别 的 语言 就 越 多 ”的 层次 性 结果 。 


11.1 复杂 度 层次 


第 10 章 说 明了 一 些 问题 是 非 确定 多 项 式 时 间 完 全 或 多 项 式 空 间 完全 的 。 为 了 证 明 一 个 特定 
的 问题 是 完全 的 ， 我 们 说 明了 需要 使 用 该 特定 问题 表示 任何 一 个 .AP TIME 和 P-SPACE 中 的 问 
题 。 证 明 的 技术 基本 是 一 种 模拟 。 例 如 ， 我 们 说 明了 布尔 表达 式 的 可 满足 性 问题 是 NP 完全 的 ， 
揭示 了 正则 表达 式 补 的 空 性 问题 是 多 项 式 空 间 完全 的 ， 通 过 直接 在 这 些 问 题 的 计算 实例 中 嵌入 
图 灵机 计算 来 得 到 这 些 结 果 。 我 们 可 将 其 他 问题 妇 约 到 某 类 问题 中 已 知 是 完全 的 问题 ， 来 说 明 
前 者 是 完全 的 。 因 此 ， 也 表明 了 .MP-TIME Al Z-SPACE 中 都 有 “最 难 的 "问题 ， 其 复杂 度 至 少 和 
该 类 中 的 任何 问题 一 样 大 。 

然而 ， 引 人 注目 的 现实 是 ， 目 前 还 没有 人 发 现 一 个 问题 在 AP-TIME ak Z- SPACE 中 ,但 不 
在 -TIME 中 。 更 进一步 ， 第 10 章 的 技术 似乎 仅 可 以 说 明 一 个 问题 至 少 和 某 一 类 中 的 其 他 问题 
是 一 样 难 的 。 为 了 实际 证 明 一 个 问题 不 在 -TIME 中 ， 需 要 一 种 技术 说 明 至 少 存在 一 种 语言 不 能 
在 多 项 式 时 间 内 被 任何 确定 型 图 灵机 所 接受 。 可 使 用 的 主要 技术 是 对 角 线 方法 。 尽 管 该 技术 不 
足以 证 明 Z7-TIME #47-TIME, 但 可 用 来 建立 确定 型 和 非 确 定型 图 灵机 的 空间 和 时 间 复 杂 度 的 层 
次 性 。 每 个 层次 性 定理 都 有 如 下 形式 : 给 定 两 个 “良好 表现 ”的 函数 A(n) 和 g(n)， 其 中 f(n) 比 
g(n) 增 长 得 “ 快 "， 则 存在 一 个 复杂 度 为 有 (n) 但 不 为 g(n) 的 语言 。 


11.2 确定 型 图 灵机 的 空间 层次 


本 节 证 明 一 个 关于 确定 性 图 灵机 的 空间 层次 性 定理 。 对 于 时 间 和 非 确定 型 图 灵机 也 有 类 似 
的 层次 性 ， 但 和 这 里 的 目的 需求 不 符 ， 因 此 留 做 练习 。 回 忆 一 下 引 理 10. 1 的 推论 3， 如 果 语 言 L 
被 一 台 空间 复杂 度 为 S(n) 的 & 带 DTM 所 接受 ， 则 工 也 能 被 空间 复杂 度 为 SC(n) 的 单 带 DTM 所 接 
受 。 因 此 讨论 可 限制 在 单 带 DTM 上 。 

为 了 得 到 空间 层次 性 结果 ， 需 要 对 DIM 进行 仿真 ， 即 对 DTM 指派 一 个 顺序 ， 使 得 对 每 个 非 
负 整 数 i 存 在 唯一 的 与 i 相 随 的 DTM。 进 一 步 要 求 每 个 DTM 在 仿真 中 出 现 得 无 限 频 繁 。 这 里 仅 考 
虑 仿真 输入 字母 表 为 10，11 的 单 带 DTM ， 因 为 这 就 是 所 需要 的 一 切 。 对 所 有 图 灵机 的 仿真 方法 
是 一 种 简单 扩展 。 


不 失 一 般 性 ， 对 单 带 DTM 的 表示 可 作 如 下 假定 。 


1. 对 于 某 个 *， 状 态 名 为 9，9 ，…，9,， 其 中 9 为 初始 状态 ，9, 为 接受 状态 ; 
2. 输入 字母 表 为 10，11 ; 
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3、 对 于 某 个 i， SRR, Xy, 0°75 X, RP X, =b, X, -0, X,=1; 

4. 下 一 移动 函数 6 BAG, X, q,, X, Da) 5 元 组 列表 ,含义 为 6(g,, X) =(a, X, 
D,), FP g, 和 gq 是 状态 ,XX 和 XX, 是 带 符号 ，D, 是 方向 ,， 依 m 的 值 0，1 或 2 分 别 表示 上 ，R 或 5。 
假定 这 个 5 元 组 列表 由 字符 串 10'1010*10'10"1 编码 。 

5. 图 灵机 本 身 的 编码 是 以 任意 次 序 将 每 个 5 元 组 的 下 一 移动 函数 的 编码 连接 在 一 起 构成 的 。 
如 果 需 要 ， 可 在 字符 串 的 前 面 放置 作为 前 缀 的 若干 个 1。 最 后 的 结果 是 以 1 开始， 由 0 和 1 组 成 
的 字符 串 ， 可 解释 为 一 个 整数 。 

任何 不 能 被 解码 的 整数 必定 是 表示 了 一 个 移动 函数 为 空 的 平凡 图 灵机 。 在 仿真 中 ， 每 台 单 
带 图 灵机 是 无 限 频 繁 出 现 的 ， 因 为 给 定 一 台 DTM， 可 以 随意 增加 前 级 1 而 得 到 表示 同一 5 元 组 集 
合 的 越 来 越 大 的 整数 。 

现在 可 以 构造 一 台 4 带 图 灵机 M, HARAR r 看 成 一 台 单 带 DTMM 的 编码 ， 同 时 也 作为 
M 的 输入 。 我 们 将 设计 图 灵机 Mo。， 使 得 对 每 台 给 定 复 杂 度 的 DIMM 至 少 存在 一 个 输入 串 ， 该 输 
人 串 能 被 M, 接 受 但 不 能 被 M 接受 ， 或 者 相反 。M。 具 备 的 能 力 之 一 是 ， 给 定 了 一 台 图 灵机 的 规 
范 ， 就 可 以 仿真 它 。 对 某 个 琢 数 S, ， 图 灵机 Mo 可 确定 图 灵机 M 是 否 使 用 不 多 于 SL x1) 个 单元 
来 接受 输入 串 x*。 如 果 M 在 空间 S, (| x1) 内 接受 x*， 则 M, 不 接受 *; 否则 M。 接 受 x。 因 此 ， 对 所 
Ai, 或 者 M, 不 同意 第 i 台 DTM 对 于 输入 x 的 行为 ， 这 里 x 是 i 的 二 进 制 表 示 ， 或 者 第 i 台 DTM 
对 于 输入 x 使 用 的 单元 数 多 于 S, Cl xt). 

可 以 说 Mo 对 所 有 空间 复杂 度 为 S,(n) 的 DIM 实行 了 对 角 线 化 ， 因 为 可 想象 一 个 无 穷 的 二 维 
表 ， 其 中 第 了 个 元 素 表示 第 ; 台 图 灵机 是 否 接 受 输入 j， 易 见 if 的 行为 将 在 对 角 线 上 和 某 些 图 灵 
机 不 一 致 。 特 别 地 ， 和 那些 在 空间 S, (n) 内 接受 它们 的 输入 的 图 灵机 不 一 致 。 由 引 理 10. 1 的 推 
论 3， 存 在 和 M, 等 价 的 具有 相同 空间 复杂 度 的 单 带 DTMM,'。 因 为 M 本 身 在 表 中 ( 即 存在 某 个 大 
值 ，M,' 是 第 上 人 台 图 灵机 )， 而 M。' 不 能 和 自己 不 一 致 ， 因 此 可 得 ，M, 和 MM,' 的 空间 复杂 度 不 为 
S,(n)。 由 于 期 望 M, 的 空间 复杂 度 是 S, (n) ， 这 里 5,(n) 和 S,(n) 是 几乎 相同 的 ， 因 此 实际 构造 
M。 是 困难 的 任务 。 

定义 令 /(n) 是 一 个 任意 函数 。inf, ,。f(n) 是 nn 趋 近 无 穷 时 , fn), f(nel), f(n*2),-- 
的 最 大 下 界 。 

例 11.1 由 于 (mw +1)7 半 是 单调 递减 的 ， 

inf cg P 1 

对 于 第 2 个 例子 ， 如 果 m 不 是 2 的 宕 ,， 令 Fn) =1-1ni WR n 2, f(n) =n, W 

inf, f(r) =1 ,因为 An), fín 1), An+2)，… 的 最 大 下 界 是 1 -1 ， 若 mn 不 是 2 的 圭 ; 或 是 








1-1/(n+1) in E2 WE, 口 
定理 11.1 4S, (n) Bn, S,(n)enZBASA THER, H 
S, (n) 


则 存在 语言 上 ， 可 被 空间 复杂 度 为 $,(n) 的 DTM 接受 ， 但 不 能 被 空间 复杂 度 为 S, (n) 的 DTM 
接受 。 





O 在 文中 ,读者 通常 会 发 现 图 灵机 的 空间 复杂 度 的 定义 中 忽略 了 输入 带 所 扫描 的 单元 数 。 然 而 ， 不 允许 修改 输入 
带 上 的 符号 。 在 这 种 模型 中 ， 讨 论 小 于 n 的 空间 复杂 度 函 数 是 有 意义 的 ， 此 时 条 件 S1(n) za 和 52(n) zn 可 以 
从 定理 的 假设 中 移 去 。 因 为 本 书 仅 处 理 大 空间 复杂 度 ， 所 以 任何 小 于 = 的 复杂 度 不 值得 详细 讨论 ， 因 此 就 忽略 
了 。 这 个 定理 可 以 放松 St(n) 是 空间 可 构造 的 这 一 限制 。 
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EA: 令 M 是 4 带 DTM， 对 长 度 为 mn 的 输入 串 x 执行 如 下 操作 。 

1. M。 在 每 条 带 上 标记 出 S, (mn) 个 单元 格 。 此 后 ， 如 果 MM 的 任意 磁头 企图 离开 标记 的 单元 ， 
则 M。 以 不 接受 该 输入 串 停 机 。 

2. Wi x 不 是 某 个 单 带 DTM 的 编码 ， 则 Mo 以 不 接受 该 输入 串 停机 。 

3. GU, $ M EBA DIM, MO RET M 使 用 的 带 符号 的 数目 上 和 状态 数 ;。M, 的 第 
3 条 带 可 以 作为 计算 :的 “工作 ”内 存 。M, 在 第 2 条 带 上 写 下 S,(n) 块 ， 每 块 包含 Tlog (| (ROG, & 
块 之 间 用 包含 符号 # 的 单元 隔 开 ， 即 : 如 果 (1 +P log 11) S, (n) <S,(n), WEA (1 +T logr]) 
Si(n) 个 单元 。 每 个 在 带子 上 出 现 的 带 符号 都 将 编码 为 Wu 第 2 条 带 上 相应 块 中 的 二 进 制 数 。 
初始 时 ，M,。 将 其 输入 以 二 进 制 编码 的 形式 放置 在 第 2 条 带 的 块 中 ， 对 未 使 用 的 块 则 用 空白 符 的 
编码 进行 填充 。 

4. 在 带 3 上 ，M。 建 立 一 个 有 「 logs] +f logs, (n) ] +T logr 1S,(n) 单 元 的 块 ， 块 上 的 所 有 单元 
初始 化 为 0， 再 次 假定 单元 数 不 超 过 S,(n) 。 带 3 作为 计数 器 计数 至 s S, (0)60 9, 

5. MS EM, HAI 即 输入 带 ， 来 确定 M 的 移动 ， 使 用 带 2 仿真 M 的 带 。 使 用 带 3 的 块 
以 二 进 制 对 M 的 移动 计数 ， 使 用 带 4 存储 M HORA. MRM ES, WM .以 不 接受 停机 ; WM 
URES, RM 的 仿真 试图 使 用 多 于 带 2 分 配 的 单元 ， 或 带 3 的 计数 溢出 ， 即 M 的 移动 次 
数 超出 了 s S, (n) 7 ， 则 M EE 

上 面 描述 的 图 灵机 M, 以 空间 复杂 度 S, (m) 接 受 某 个 语言 上 。 假 定 工 被 某 个 DTIMM, 以 空间 复杂 度 
S,(n) EXE, E3938 10. 1 的 推论 3， 可 假定 M., 是 单 带 图 灵机 。 令 有 * MRA MEARS. HM, 
的 5 元 组 排 成 一 列 ， 如 果 需 要 ， 则 加 上 前 缀 1， 可 以 发 现 一 个 长 为 n 的 表示 Mw, KB 
足够 大 , 使 得 S, (n) 大 于 MAX[1 +floøgt])S, (n), [log s] * [log SS,(n)1+[logt1S,(n)]。 
inf, ,。[ S, (n)/ S, (n) ] =0 的 事实 保证 可 以 找到 这 样 的 n。 接 着， 给 定 w 作为 输入 ，hM 有 足够 的 空 
间 仿 真 M, MZ w 当 且 仅 当 MAES w。 但 已 经 假定 MBL, PARA, MAMEA 
的 。 由 此 可 得 ，M, 是 不 存在 的 ， 即 工 不 能 被 任何 空间 复杂 度 为 S, (n) 的 DTM 所 接受 。 口 

定理 11.1 的 典型 应 用 是 用 来 说 明 ， 例 如 ， 存 在 一 个 语言 可 被 空间 复杂 度 n^ logn 的 DTM 所 接 
受 ,但 不 能 被 空间 复杂 度 为 n^ B DTM 所 接受 。 其 他 应 用 则 见 本 章 的 剩余 部 分 。 


11.3 一 个 需要 指数 时 间 和 空间 的 问题 


10.6 节 考 虑 了 正则 表达 式 的 补 的 空 性 问题 ， 说 明 它 是 多 项 式 空间 完全 的 。 由 于 正则 集 的 类 
关于 交 和 补 运算 是 封闭 的 ， 将 交 运 算 符 咱 和 补 运算 符 ” 添加 到 正则 表达 式 中 并 不 会 提升 其 所 描 
述 的 集合 的 类 。 然 而 ， 使 用 交 和 补 运 算 符 会 大 大 缩短 描述 某 些 正则 集 的 正则 表达 式 的 长 度 。 由 于 
具备 浓缩 的 能 力 ， 当 时 间 的 度量 是 以 给 定 表达 式 的 长 度 为 基础 时 ， 对 于 一 些 问题 ， 扩 展 正则 表达 
式 需 要 比 “ 通 常 的 "正则 表达 式 更 多 的 时 间 来 求解 。 

定义 字母 表 e 的 一 个 扩展 正则 表达 式 可 定义 如 下 : 

le, Ø, (HP a  ÉT e) ERRA El, 名 1 和 1al 的 扩展 正则 表达 式 ; 

2. du R, fa R, 分 别 是 表示 语言 上 和 上, 的 扩展 正则 表达 式 , WR, + R), (R: R), 
(Ri), (R,OR,)fs(o R,) 世 是 扩展 正则 表达 式 ， 分 别 表示 语言 LULb, LL, Ll), L nL, fa 
LZ’ -Lo 

如 果 假 定 运 算 符 的 优先 级 按 递增 序 为 

+ N a . * 
可 进一步 将 从 扩展 正则 表达 式 中 消去 。 
进一步 ， 运 算 符 . 通常 可 以 省 略 。 例 如 an b «cd 意思 是 
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((a * (5 (5*))) + (end)) 

一 个 扩展 的 正则 表达 式 如 果 不 包含 补 符号 则 称 为 半 扩 展 的 。 半 扩展 正则 表达 式 的 补 的 空 性 
问题 是 确定 给 定 的 表达 式 R 所 表示 的 集合 的 补 是 否 为 空 (等 价 的 说 法 是 , RR 是否 表 示 输 入 字母 表 
上 的 所 有 字符 串 ) 。 例 如 ， 正 则 表达 式 

b' +b’ aa (e*b(a*b)(a*b)') *b'aa'b 
表示 (a +b)’, RRE 
b' «baa  (e*b(acb)(a«cb)') =n b'aa'b 

现在 开始 证 明 半 扩展 正则 表达 式 的 补 的 空 性 问题 不 在 P-SPACE H, HF SPACE 包含 
AP-TIME ,因此 也 不 在 .MP-TIME 中 。 事 实 上 ,我 们 将 说 明 存 在 长 度 为 5 HEP REM RAR, 
至 少 需要 c'c "m zs qa] (ROSE [8] ) 来 求解 补 的 空 性 问题 ， 这 里 常数 >0，c> 1。 

在 11.4 节 ， 我 们 可 以 看 到 完全 扩展 的 正则 表达 式 的 补 的 空 性 问题 比 半 扩 展 的 正则 表达 式 难 
得 多 。 为 了 预期 的 结果 ， 本 节 将 给 出 许多 完全 扩展 的 正则 表达 式 的 结果 。 

除了 10. 6 节 中 使 用 的 简写 法 外 ， 这 里 将 使 用 三 i.1R; 表示 扩展 正则 表达 式 R, +R, +… +R, Æ 
会 使 用 R' 替代 RR" 。 当 谈 及 表达 式 的 长 度 时 ， 是 指 由 这 些 简 写 形式 所 表示 的 实际 表达 式 的 长 度 。 

现在 引入 衡量 尺度 的 记 法 。 令 工 是 一 个 字母 表 ，* 是 属于 工 "的 任意 字符 串 。 则 CYCLE(x) 
= {zy] x=yz, ye E’, ze "|。 令 # 是 不 属于 辽 的 一 个 特殊 标记 符号 。 则 集合 CYCLE (x#) 称 
HEKE) x#1 的 衡量 尺度 。 即 ， 衡 量 尺度 是 串 x# 的 所 有 循环 排列 的 集合 。 在 不 引起 混淆 的 情 
况 下 ， 有 时 也 将 x# 本 身 看 成 是 “衡量 尺度 ”。 

下 面 将 使 用 衡量 尺度 度量 在 有 效 的 图 灵机 计算 中 D 的 长 度 。 首 先 说 明 某 些 长 的 衡量 尺度 可 
以 使 用 相应 较 短 的 半 扩 展 正则 表达 式 表示 。 

引 理 11. 1 对 每 个 上 >1， 存 在 长 度 大 于 关 的 衡量 尺度 ， 可 以 用 半 扩 展 正 则 表达 式 R 表示 ， 
使 | RI sc, c 是 独立 于 上 的 常量 。 

ERA: 令 4=|a。，a,，…，ai| 是 +1 个 不 同 字符 的 字母 表 。 E z = aya, x, = X10;%;-10; 
(lsi<k), Bik 

x, =(…(( ana, )a,)^--:a,)* 

的 长 度 为 2，x; 的 长 度 大 于 ”的 长 度 的 两 倍 。 因 此 ，x, MERECE REF 2", k=l. 

令 CYCLE(x, as) 为 期 望 的 衡量 尺度 。 仍 需要 说 明 存 在 一 个 表示 集合 CYCLE(x -as ) 的 半 扩 
展 正 则 表达 式 。 l 

对 于 0<i<k, GARR +a + +a), A-A RIR la a ta teta) F 

Ry = aga, [ (A - Ay) “ao] "(A-A)" 
* al (A-A,) “ao] "(A-A) “ao 
+ [(4-A) ao] ' (A-A) ' a.a (A A) " 


R, 2 A/ aA ,a,[ (A- AD * (aj ,a,)? ] x (A-A) Af, 
ta, A ,a,[(A-A,)* (A? ,a,)’] * (A-A,) "Aj, 
+A*,a,[(A-A,) * CAZ a) ] * (A-A,) "Af. A7, 
*a,[ (A-A ! (A/,2,)!] *(A- AD "A! aA 
*[(A-A) * (A/,2,))! ] * (A-A,) "Af aA} a(A A) " 
其 中 1<i<k-1。 
我 们 断言 半 扩 展 正则 表达 式 
R= RARO OR, NA aA, 
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表示 CYCLE(x, ,a,) , WEBB, HERD IAAT AR, NR, NOR 字符 串 的 形式 为 
y,{ (A-A,) *x,]*(A-A) ^5 
+[(A-A,) xz] (A- A ^ (A -A 
这 里 yy. = ko 
归纳 基础 : 对 于 i=0，R, 精 确 表 示 了 形式 为 
aL (A-Ay) “a5 }* (A-A)' A 
+[(A4-A)'ai]’(A-A)'aa (4 - Ay) " 
WAR, O<j<2, KX x, = ao ， 所 以 结果 是 显然 的 。 
妇 纳 步 ” 假 定 尺 mmRn…mnR ,_ ,表示 了 所 有 形式 为 
yl (A- AL xi (4A -A,.0 ^y, 
£[(A-4,,)*x,4]' (A - AL) ^ 4(4 -A,4)" (11-1) 
的 字符 串 ， 这 里 yy Eto 
考虑 式 (11-1) 和 尺 交 集中 的 字符 串 z. A. ERECTA LER: -1， 除 非 其 位 于 串 的 头 
或 尾 ， 在 这 种 情况 下 ,是 y', 或 y 1。 因 此 ，R, 中 的 47, 可 以 替换 为 x,.,( 除 非 其 位 于 正则 表达 式 的 
JB) AR, CF RUE AS ALAS ,可 以 分 别 被 替换 为 y', y' o HER x; ai; a; =%;， 可 
得 
RAR NNR, s y',ax, a [ (4 A) x] (A-A) ty . 
+a,%,_,a,[(A-A,) ^x; ]' (A-AD ^x; , 


+ y',a,[ (A-A) 'x,] ' (A- A) ' x; 0,9", (11-2) 
十 a,[ (A-A,) 'x,] (4-4) ^x; ax; 
十 [(4-A) '*x,] ' (A-A) 'x;.,ax; ,a, (A -A " 


最 后 ， 式 (11-2) 可 以 重 写 为 
X [(4-A)0'x,]'(4-A) y, 
*[(A-ADOx,] (A-A) x (A-A) 

HP yy =x;。 可 使 用 归纳 假设 。 令 i=k-1 PR ERS Aj aA 进行 交 操 作 ， 由 结果 可 知 尺 表 
示 CYCLE(x, ak ) 0 

剩 下 要 证 明 的 是 只 所 表示 的 扩展 正则 表达 式 的 长 度 界限 是 ck 。 该 结论 由 以 下 事实 立即 可 
得 : 存在 常量 c ， 使 得 由 每 个 缩写 的 尺 所 表示 的 正则 表达 式 的 长 度 界限 是 ck。 即 ，4, 和 4 -4; 表 
示 长 度 为 0(E) 的 扩展 正则 表达 式 。 因 此 ， 每 个 定义 R, 的 项 的 和 表示 长 度 为 O(k) 的 扩展 正则 表 
达 式 。 因 此 ， 半 扩展 正则 表达 式 R 的 长 度 界 限 是 ch’, Hc 是 某 个 新 的 常量 。 口 

使 用 类 似 引 理 11. 1 的 构造 过 程 ， 可 写 出 简写 的 正则 表达 式 以 表示 除了 x =x,_1 外 的 所 有 AT 
中 的 串 。 该 正则 表达 式 使 用 刚 构造 的 对 应 于 CYCLE(x#) 的 半 扩 展 正则 表达 式 R, 

引 理 11.2 ” 设 字 母 表 4 = |a。，a,，…，a,| 与 字符 串 x, 如 引 理 11.1， 则 存在 一 个 表示 ” x, 
的 长 度 为 0( 廊 ) 的 正则 表达 式 。 

证 明 : Bx, BPR. 

DESFA oo 开始 。ao 成 双 出 现 ， 并 且 每 次 成 双 出 现 之 后 跟随 着 一 个 a 。 

ii) a; 也 是 成 双 出 现 的 ，1 <i<k -2。 每 对 出 现 的 a 都 被 co4…, 中 的 串 分 隔 ， 并 且 对 中 的 第 2 
个 a, 之 后 跟随 着 a,,, 。 即 a 的 左边 是 A, ,中 的 专 有 符号 ， 或 直接 在 它 左边 的 是 4 - 4, 中 的 符号 接 
着 是 oo 后 接 4 中 的 字符 串 。 

ii) fA 8 PSP a;_, 的 实例 ， 第 一 个 后 接 一 个 a。 ， 第 二 个 在 串 的 右 端 。 

更 重要 的 是 ，x, ,是 唯一 的 遵循 这 些 规则 的 串 。 通 过 对 j 进行 归纳 可 得 ， 如 果 bib, b 是 满足 
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上 述 3 条 规则 的 一 个 捉 的 前 级， 则 5.8,…b 是 %., 的 前 缀 。 例 如 ， 由 规则 (i) ， 第 一 个 符号 是 ao。 
同样 由 规则 (i) ， 单 独 的 ao 不 会 终结 一 个 字符 串 或 后 接 一 个 不 是 a 的 符号 ， 因 此 字符 串 由 aoao 开 
始 。 接 着 由 规则 ( 立 ) ，i=1 时 ， 串 aaa VER om ， 依 此 类 推 。 形 式 的 归纳 证 明 留 给 读者 作为 
练习 。 由 于 xx _; 事 实 上 满足 规则 ， 可 以 看 到 其 必定 是 满足 这 些 规 则 的 唯一 串 。 

容易 写 出 表示 不 满足 上 述 3 条 规则 之 一 或 更 多 的 串 的 正则 表达 式 。 不 满足 规则 ( i ) 的 串 表 
RON? 

S; zet(A-a,)A' +A`apa | (A-a,)A" +e] +le+A* (A-a ]a,( (A-a,)A" +e] 

SWS 1 项 表示 空 串 ， 第 2 项 表示 不 是 从 oo 开始 的 串 ， 第 3 项 表示 包含 一 对 ao 但 其 后 不 跟随 
ww 的 串 ， 最 后 一 项 是 包含 单独 的 wm 的 串 。 那 些 不 满足 规则 ( 羡 ) 的 串 则 由 下 式 表 示 

$ - XL aA mL (4 72,47 +e] Le A (4A) JAZ n LA- a)" e] 
Ea. RUE XL Cu) 的 串 是 
S, 2A'a, Aa, A c (A-a, D 'aLa(A-a, 4) Aa) *(A-a a, ,(A-a)A' 

在 % 中 ,第 1 项 除了 包括 正好 含有 两 个 m_, 的 串 外 ， 还 包括 含有 多 于 两 个 w,_, 的 所 有 串 ， 其 

中 第 二 个 a 不 位 于 串 的 右 端 。 因 此 S, USUS SERO x... BS, US, US, AKER O), 
口 

在 说 明 半 扩展 正则 表达 式 补 的 空 性 问题 不 存在 多 项 式 空间 界限 或 多 项 式 时 间 界 限 的 算法 之 
前 ， 先 进行 两 个 基本 的 考察 。 

定义 ALS ATS 的 同 态 映 射 hh 是 一 个 函数 ， 对 任意 串 x 和 y,， 有 h(xy) e h(x)h(y) d 
wh, h(e) se, h(a,a,--a,) =h(a,)h(a,) --h(a,) , Ak, ARR AHL, 中 的 每 个 a 的 h(a) 
值 所 唯一 定义 。 

ENTE, 中 的 每 个 a, h(a) BEY, 中 的 单一 符号 ， 则 称 同 态 映射 h 是 保持 长 度 的 。 保 
持 长 度 的 同 态 映射 仅仅 是 对 符号 重 命名 ， 可 通过 重 命名 将 几 个 符号 有 看 成 同一 符号 。 如 果 vw 在 
Xe P, BA (w)-ixlh(x)zwl, WEÉLCYX, WA (L)2ixl h(x) eLl, 

例 11.2 SY, ={a, b, cl, E,-10, 1}。 如 下 定义 同 态 映 射 h, h(a) 2010, h(5) =1, 
h(c) =e, Wi h(abc) =0101。 可 见 天 不 是 保持 长 度 的 同 态 映射 。 令 了 是 由 扩展 正则 表达 式 1 + 
-1' 或 由 等 价 的 一 般 正 则 表达 式 1 + (0 +1)'0(0+1)' ERBAA, WA (LL) 可 由 扩展 正则 表 
AR c'be’ & (bec) “表示 ,或 由 一 般 正 则 表达 式 c' 0c" + (a+b+c)"a(a+b+c) RR O 

引 理 11.3 令 h 是 保持 长 度 的 从 ? BL, 的 同 态 映射 ，R, 是 表示 集合 SG 并; 的 一 个 扩展 
正则 表达 式 ， 则 可 以 构造 一 个 表示 h-'(S) 的 扩展 正则 表达 式 R,，R, 的 长 度 界 限 是 R, 的 长 度 的 常 
BERF h), FENH R, 包 含 一 个 补 符号 时 R, 也 包含 一 个 补 符号 。 

证 明 : 将 RPE, 的 每 个 符号 出 现 蔡 换 为 一 个 正则 表达 式 ， 表 示 所 有 由 映射 为 该 符号 的 集 
合 。 例 如 ， 如 果 { a,，a,，…，a,| 是 映射 为 a 的 符号 集合 ， 则 将 a 替换 为 (a, ta, +… 2). > 
REIKI REWA., RER h(S) 的 证 明 则 可 通过 对 忆 中 运算 符 +，: ，* ， 站 和 = 
的 出 现 数目 进行 归纳 而 得 。 口 

现在 必须 如 同 引 理 10. 2 那样 讨论 图 灵机 的 瞬时 描述 序列 的 表示 。 即 给 定 图 灵机 到 = 10，7， 
1, 6, 6, qo, q,| ， 通 过 了 中 的 符号 序列 加 上 一 个 形 为 [98] 的 其 他 符号 来 表示 一 个 也 ， 这 里 7 e 
C@,，xe7 分 别 表示 状态 和 输入 磁头 的 位 置 。 如 果 需 要 ， 可 使 用 一 些 空格 来 拉 长 一 个 卫 以 使 同一 
个 计算 中 的 所 有 ID 有 相同 的 长 度 。 





k 
O 使 用 4 - a; 表示 2》 ai。 
i 


258 gus 


AY EE ID 中 的 符号 和 后 继 ID 中 的 “相应 ”符号 ， 我 们 将 一 个 表示 ID 长 度 的 衡量 尺度 
与 功 本 身 放置 在 一 起 。 形 式 化 地 说 ,使 用 一 个 “双轨 ”的 符号 串 ， 上 轨 是 D 序列 ， 下 轨 则 包含 
重复 的 衡量 尺度 。 即 “双轨 ”符号 是 对 La,，61]，a 是 上 轨 中 的 符号 ,5 是 下 轨 中 的 符号 。 该 格局 如 
图 11-1 所 示 ， 其 中 使 用 的 衡量 尺度 是 CYCLE( x#) (x 是 不 包含 # 的 任意 字符 串 。) 

定义 给 定 TM M, FA, =TU(QxT)U 1#| ，A, 是 在 弹 中 出 现 的 符号 集 含 。 即 Ai 是 可 以 
出 现在 上 轨 中 的 符号 集合 ，A, 是 可 以 出 现在 下 轨 中 的 符号 集合 。“ 双轨 ”的 字母 表 是 A, x Avo 1 
EREA CYCLE (1#) t) 用 的 一 个 有 效 计算 是 如 图 11-1 所 示 的 (A x AJ) “中 的 串 ，M 的 一 个 移动 
可 使 C, EC, Oi «f, Co 是 初始 ID， 在 最 后 一 个 ID Cr 中 状态 是 gre。 在 ID 的 末尾 填充 空白 使 所 
AIWAKR RAI x1 。 





图 11-1 带 衡量 尺度 的 ID 序列 


引 理 11. 4. SR, AMT CYCLE(x#) 的 扩展 正则 表达 式 ， 尺 ,是 x# 的 字母 表 上 表示 除了 x 
外 所 有 串 的 正则 表达 式 。 可 以 构造 一 个 表示 M 的 衡量 尺度 为 CYCLE (x) 的 一 个 无 效 计算 的 扩展 
正则 表达 式 R, RAKES) RI + 1 R | 成 线性 比例 ， 比 例 常数 仅 依赖 于 Mo NARRER, 
包含 一 个 补 符号 时 ，R, 包 含 一 个 补 符号 。 

证 明 ; 一 个 串 是 衡量 尺度 为 CYCLE(x#) 的 一 个 无 效 计算 ， 当 且 仅 当 

1. 下 轨 不 在 #(x#) h, RE 

2. FAEH) " 中， 但 上 轨 不 是 一 个 有 效 的 计算 。 

如 果 A, 是 上 轨 的 字母 表 ，A, 是 下 轨 的 字母 表 ， 令 丸和 大 分 别 是 从 (A, x AJ) 8I A” 和 到 
A; 的 同 态 映射 ,满足 h([a, b]) =a, h,([a, b]) =5。 则 

hi UAZ #(R' Y (A, —#)" )#A; + (A, - #) AS +A; (A, ~-#)] +e 

仅 表 示 所 有 下 轨 不 在 #(x#)" PR, h 参数 的 第 一 项 表示 那些 两 个 # 之 间 不 是 x 而 是 其 他 
东西 的 串 ， 其 他 项 则 表示 不 是 以 # 开 始 或 结束 的 串 。 由 引 理 11.3， 存 在 一 个 长 度 与 表示 该 集合 
LRL 成 比例 的 扩展 正则 表达 式 。 

一 个 给 定 的 串 满足 条 件 2 是 因为 由 等 于 衡量 尺度 的 若干 符号 所 分 隔 的 两 个 符号 并 不 反映 M 
的 移动 ， 或 因为 发 生 了 一 个 或 若干 个 下 面 的 格式 错误 。 

i ) 在 上 轨 中 ， 串 不 是 以 # 开 始 或 结束 ; 

六) 在 第 一 个 ID 中， 没有 状态 或 有 两 个 或 更 多 的 状态 出 现 ; 

iii) B— ID 没有 包含 初始 状态 作为 其 第 一 个 符号 的 成 分 ; 

IV ) 接 受 状 态 不 作为 任何 符号 的 成 分 出 现 ; 

V ) 第 一 个 ID 的 长 度 不 正确 。 即 上 罗 中 的 前 两 个 # 不 像 下 轨 中 的 前 两 个 # 一 样 位 于 相同 的 单 
元 格 中 。 

下 面 将 看 到 对 于 (A, x A,)“ 中 不 能 反映 M 的 合法 移动 的 序列 如 何 写 扩展 正则 表达 式 。 如 同 
引 理 10. 2， 我 们 注意 到 在 有 效 的 计算 中 ， 上 轨 中 的 3 个 连续 符号 cee; 唯一 确定 放置 于 符号 oH 
边 的 符号 1 Hi 。 与 以 前 一 样 ， 设 这 个 符号 为 f(cicsc;)。 令 

Ry oe, = (A, + A,) . [hr (ee e, AL ) nA (R, ) ] (Aj CA,CA, -fCeieses) )A, ) 1(A, x A,) ” 

(11-3) 
Bee 
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TER, hi (eec, AL KRCA, x AL) "中 的 所 有 上 轨 以 c cuc FARR, AI CR SER PRE 
正确 的 且 长 为 1 x#1 的 串 。 由 此 ， 它 们 的 交 是 所 有 长 为 1 x#1 KHR, ATAA CYCLE (ast) 中 
的 串 ， 且 上 轨 以 cczc 开 始 。 基 于 这 些 观 察 ， 很 清楚 ，R 包括 了 所 有 满足 条 件 2 的 串 ， 它 们 反映 
了 MER itti Y dEHRIU RESO. ROE PRR a(t) " 中 的 串 ; 这 些 串 满足 条 件 1， 它 们 在 R 
中 出 现 或 不 出 现 不 是 实质 的 。 进 一 步 ，R 的 长 度 是 R, 长 度 的 常数 倍 ( 依 琅 于 MN) 。 为 了 说 明 其 真 
实 性 ， 注 意 到 AI 将 正则 表达 式 扩 展 了 与 M 相关 的 常数 倍 。 另 外 ，h， 最 多 将 表达 式 扩展 了 3 
A, | 倍 ， 原 因 是 对 于 恰好 8 个 5 的 值 ， 如 果 有 (5) =a, W hi (a) = (b, +b, + +b WREN 
2k+1, HFI<k< | A, | 是 显然 的 ， 所 以 1 A, (a) | <3] A, |. EH, AWA, PHB 
符号 都 在 RR, 中 出 现 ， 很 清楚 有 |A TRES KE, (11-3) PIER, (eco A1) REA, (A, 
(A, 一 f(e66,) )A1) 的 长 度 是 0 (1 RI )。 最 后 ， 相 应 于 hj (R,)RICA, X A,)' 的 项 的 长 度 很 明 
显 是 0 (| R,1 )， 其 中 的 常数 仅 依赖 于 MM。 因 此 ， 式 (11-3) 的 长 度 即 R KER OCI RI + | 
Ru) 

容易 写 出 对 应 于 格式 错误 的 正则 表达 式 ， 这 留 给 读者 完成 。 按 这 种 方式 ， 可 以 构造 一 个 扩 
展 正则 表达 式 R,， 其 长 度 和 1 RI + | RI RREN, BŚ RER, 包含 一 个 补 符号 时 RE, 
包含 一 个 补 符号 。 口 

定理 11.2 确定 半 扩 展 正 则 表达 式 是 否 表示 了 其 字母 表 上 所 有 串 的 任意 算法 2 的 空间 复杂 
度 (和 时 间 复 杂 度 ) ED Ecce, Htc’ >0 和 c>1l 是 常数 ,的 数目 是 无 穷 的 。 

ER: 令 工 是 空间 复杂 度 为 2" 但 不 为 2"/n 的 任意 语言 (由 定理 11. 1 可 知 这 样 的 语言 是 存 
在 的 ) 。 令 M 是 接受 语言 的 DTM, 

假定 有 一 个 空间 复杂 度 为 /(n) 的 DTM M,， 可 判别 由 一 个 半 扩 展 正则 表达 式 表示 的 集合 的 补 
是 否 空 。 则 可 以 按照 如 下 方式 使 用 MBSR L Ow = cia…o 是 长 为 的 输入 串 。 

1. 构造 长 度 的 衡量 尺度 为 2 +1 或 更 大 的 半 扩 展 正则 表达 式 R,。 由 引 理 11.1( 取 k=n), TE 
在 一 个 长 度 为 0( 肥 ) 的 表达 式 R,。 进 一 步 , R, 可 以 只 使 用 空间 复杂 度 0( 必 ) 构 造 。 类 似 地 ， 构 造 
表示 nx YR, XE R, = CYCLE(#)。 由 引 理 11.2，R', KEE O(n’), ABAH R TEA 
空间 O(n?) HAE 

2. 构造 一 个 半 扩 展 正则 表达 式 R, 以 表示 衡量 尺度 为 R 的 M 的 无 效 计算 。 由 引 理 11.4， 存 
在 一 个 长 度 至 多 为 ow R, c WRF M 的 常量 。 

3. 构造 一 个 正则 表达 式 R, 以 表示 所 有 (A, x A,) 中 的 上 轨 不 以 #[ qua, ] a; a,b ETT ES 
MAR, 其 中 go 是 M 的 初始 状态 。 很 明显 长 度 为 0(n) 的 表达 式 R, 是 存在 的 。 因 此 ，1 R, +R | 
sar, cU EHE 

4. BAM, FR, +R HIS R, + 已 的 补 是 否 空 。 如 果 不 空 ， 则 存在 M 的 一 个 输入 为 由 的 有 
效 计算 ， Alkw LH, AM, w 不 在 工 中 。 

可 以 构造 一 个 空间 复杂 度 为 /cmlog mn) 的 DTM M' 以 实现 这 个 识别 上 的 算法 。 /参数 中 的 
log nm 因子 是 由 于 正则 表达 式 R, +R en 个 符号 的 字母 表 上 的 ， 必 须 编 码 为 固定 的 字母 表 。 因 为 
我 们 假设 是 空间 复杂 度 为 2" 但 不 为 2"/n 的 语言 ， 所 以 至 少 对 某 些 n EDU fe; n log n) > 27 
n。 但 对 有 限 数 目的 n， 车 f( ce,n*log n) SET 2"/n， 则 存在 上 述 识别 算法 的 一 个 修正 版 本 , CË 





”假定 使 用 类 似 于 引 理 10. 3 中 的 编码 方法 。 


O 2 的 选择 不 是 本 质 性 的 。 可 以 将 2 替换 为 任意 的 指数 耳 数 儿 n) ，2"/n 替换 为 任意 的 增长 速度 较 /(n) 慢 的 函数 ， 
只 要 每 个 都 是 空间 可 构造 的 即 可 。 
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先 通过 有 限 的 "“ 表 查看 "检查 1 w | EBE Sn log n) > 2'/n 成 立 的 一 个 n 值 。 如 果 是 , v 是 否 
在 LL 中 。 因 此 ， 对 于 无 穷 数 目的 n，f(cn*log n) 超 过 了 2"/n， 这样， 对 于 无 穷 数 目的 m 和 常量 c, 
>0, c»0 Mc’ >1, Am) >2° "7, /m/logmz»c(c') ^", 口 
推论 半 扩 展 正则 表达 式 的 等 价 问题 需要 c "时间 和 空间 开销 ， 其 中 常数 ce? >0，c > 1， 
n 的 数目 是 无 穷 的 。 
证 明 : 因为 表示 所 有 串 的 正则 表达 式 是 简短 且 容 易 写 出 的 ， 容 易 证 明 补 集 为 空 的 问题 可 多 
项 式 归 约 为 等 价 问题 。 口 


11.4 一 个 非 基 本 的 问题 


现在 考虑 整个 扩展 正则 表达 式 类 。 因 为 有 补 算 子 ， 仅 需要 考虑 空间 题 ， 即 给 定 的 扩展 正则 
表达 式 RR 是 否 表示 一 个 空 集 。 可 以 看 到 使 用 补 算 子 可 以 更 加 紧凑 地 表示 正则 集 ， 另 外 扩展 正则 
表达 式 的 空 性 问题 比 半 扩 展 正则 表达 式 的 补 集 为 空 的 问题 更 难 。 

定义 函数 (m, n) WI: 

1. g(0, n) =n, 

2.g(m, n) 2*"^"", m»0, 

Hilt g(1, n) = 2", g(2, n) -27, HB 

2 
g(m, n) -2 
APA mh 2, Ba 2 的 nn 次 方 。 称 函数 /(n) 是 基本 的 (elementary) ， 如 果 对 于 所 有 n( 除 了 一 
个 有 限 集合 外 ) 其 上 界 是 g(m。，n)， 其 中 mo 是 某 个 固定 的 整数 。 

11. 3 节 的 技术 可 用 来 说 明 不 存在 基本 函数 5S(n) 使 整个 扩展 正则 表达 式 类 的 空 性 问题 的 空间 
复杂 度 为 5S(n) 。 在 处 理 之 前 ， 对 衡量 尺度 为 CYCLE(x#) 的 图 灵机 M=(@, T, 1, 8, b, qos qi) 
的 有 效 计算 的 定义 稍 做 修改 。 删 去 第 一 个 标识 符 #， 将 最 后 一 个 标识 符 改 为 一 个 新 的 符号 $ ， 如 
11-2 所 示 。C 是 ID( 如 果 需 要 ， 则 拉 促 与 4 等 长 ) 。W 的 一 个 移动 可 使 C, FCn Oi «f, C, 
是 初始 ID， 在 最 后 一 个 C; 中 状态 是 qi。 

使 用 下 面 的 惯例 记 法 。 假 定 xe L*. 

LA, =TU(Qx7T)U 1|#，$ 1 是 上 轨 字 母 表 ; 

2. A, = ZXUlf, $I PRR; 

3.h,; A, xA,-A,, APh (la, b]) =a; 

4.h,: A, xA,>A,, HPA, (La, b]) =b, 


aasg 
maag 


11-2. ” 带 衡量 扩 度 的 有 效 计算 的 新 格式 


引 理 11.5 令 玉 是 一 个 对 应 于 CYCLE (x4) 的 扩展 正则 表达 式 。 可 以 构造 一 个 扩展 正则 表达 
式 R,， 表 示 衡 量 尺度 为 CYCLE( 奢 ) 的 图 灵机 M 的 有 效 计算 的 循环 排列 的 集合 ， 满 足 1 RI 等 于 
O R,1) ， 常 数 因子 仅 依赖 于 M, 

证 明 : 一 个 串 是 衡量 尺度 为 CYCLE( x#) 的 有 效 计算 的 循环 排列 ， 当 且 仅 当 

1. 下 轨 是 形 为 (x#) "x $ 的 串 的 一 个 循环 排列 ; 

2. 上 轨 是 M 的 有 效 计算 的 一 个 循环 排列 ; 
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3. 上 轨 和 下 轨 循 环 排列 的 次 数 是 一 样 的 。 

4 R', ER PRERA $ 所 得 的 扩展 正则 表达 式 。 满 足 条件 1 的 串 可 用 h, CU, YU, YU.) 
表示 ， 这 里 

U,= 2° (#+ $)[(R, +R NCD H+ DS) E" 
U,=(L+#)°$( L+H)" 
U,=(R, +R’,)* 

U, PAF RAR (CR, + RAC LD 89 X $0 | RATE xix $ 5 BI, UR EL" (# 
+ $)#$) X', RERUMARABA—TS HWE. At, UU, PHERR ABH 

yy lixlbct-- xdix $ xi^ xiiy, 

KB yH y, JECEXCS KAA UVE yl + 1 y,1 = 1x1 ,由 此 容易 看 出 ,对 于 UNU, 
NU, PA, A yy, =x. KE, S= UN UN 表示 满足 条 件 1 HBA PS 

对 于 条 件 2， 引 理 11. 4 说 明 如 何 写 对 应 于 衡量 尺度 为 CYCLE (oft) 的 M 的 有 效 计算 的 半 扩 展 
正则 表达 式 。 这 些 技术 容易 表示 为 图 11-2 所 示 的 格式 ， 而 表示 下 轨 上 衡量 尺度 正确 的 图 灵机 M 
的 无 效 计算 的 循环 排列 的 表达 式 E 的 工作 则 留 给 读者 自行 构造 。 对 EE 应 用 补 算 子 的 结果 是 正则 
BRAK S,。 这 是 唯一 使 用 补 算 子 之 处 。 很 清楚 ，5, nsS: 表 示 的 所 有 串 都 满足 条 件 1 和 2。 

当 条 件 1 和 2 满足 时 ， 相 应 于 条 件 3 的 表达 式 是 容易 得 到 的 。 仅 需 检查 在 双轨 中 一 个 符号 是 
$ 即 可 。 将 该 表达 式 和 S, nS, 相 交 即 可 完成 定理 的 证 明 。 口 

现在 说 明基 于 引 理 11.5 的 构造 方法 ， 对 于 长 度 的 稍 许 增长 ， 该 如 何 表示 越 来 越 长 的 衡量 
尺度 。 

直观 上 说 ， 先 对 一 个 较 小 衡量 尺度 比如 n， 构 造 一 个 正则 表达 式 ， 接 着 使 用 该 衡量 尺度 对 所 
有 正好 接受 长 度 为 n 的 输入 串 的 某 个 图 灵机 上 的 关于 该 衡量 尺度 的 有 效 计算 的 循环 排列 构造 一 个 
新 的 正则 表达 式 。 仔 细 选 择 该 图 灵机 ， 使 其 对 于 长 度 为 4 的 输入 ， 至 少 移动 2 次 ， 这 样 其 有 效 
计算 的 循环 排列 的 集合 本 身 是 长 为 2" 或 更 大 的 衡量 尺度 。 使 用 新 的 衡量 尺度 重复 上 述 过 程 ， 得 
到 的 是 越 来 越 长 的 衡量 尺度 ， 至 少 是 2 ，2” 等 等 。 

令 il 是 行为 如 下 的 一 台 特 殊 的 单 带 图 灵机 。 

1. 1 通过 扫描 它 的 输入 带 直到 遇 到 第 一 个 空白 格 以 检查 它 的 输入 带 是 否 以 一 串 a 开始 ; 

2. 如 果 其 输入 带 是 以 m 个 a 后 随 一 个 空白 格 的 字符 串 开始 ， 则 MM 对 输入 带 上 的 a 和 随后 的 
空白 格 部 分 以 二 机 制 形式 从 0 到 2”' -1 计数 ; 

3. 当 MM 计数 至 2"' -1 时， 停机 接受 。 

注意 下 面 关 于 M, 的 事实 。 对 每 个 n，M, 恰 好 接受 的 是 长 度 为 n WA, Blo’, HERR 
有 效 计 算 包 括 至 少 执行 2" “次 移动 ， 一 半 用 于 位 加 法 ， 一 半 用 于 进位 。 最 后 ， 当 给 定 长 度 为 n 的 
输入 时 ，M, 仅 扫描 了 n+1 个 带 单 元 。 

所 以 ， 考 虑 图 11-2 所 示 的 衡量 尺度 为 CYCLE(x#) 的 M, 的 有 效 计算 ， 如果 1 xd =1， 则 存在 
唯一 的 上 轨 以 [qoa jae…ab# 起 始 的 有 效 计算 。 由 引 理 11.5， 可 以 构造 一 个 正则 表达 式 R URRE 
量 尺度 为 CYCLE(x#) 的 Mo 的 一 个 有 效 计 算 的 循环 排列 。 表 达 式 R, 表 示 由 (A, x A) "中 的 固定 串 
w 的 循环 排列 所 组 成 的 集合 。 串 h (w) J& Wo 针对 输入 CHARTER, 这 里 的 1 x1 值 ， 回 想 一 
下 ， 现 在 是 n+1。 因 为 对 于 输入 e" ，M。 至 少 移动 2 次 ， 可 以 使 用 尺 本 身 作 为 长 度 至 少 为 2 
的 衡量 尺度 。 

总 之 ,假设 给 定 衡 量 尺度 R, = CYCLE(x#) ， 其 中 xe 二” 。 可 以 基于 民 构 造 一 个 衡量 尺度 至 
少 为 2 ” 的 特殊 的 图 灵机 。 由 引 理 11.5, ， 对 于 该 衡量 尺度 存在 长 度 至 多 为 c | R! 的 扩展 正则 
表达 式 R, RE c1 仅 依赖 于 Mo 。 
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引 理 11.6 对 所 有 的 i=1 MmS2, fEKH EA gl, m) OMSERE, TWWAKES 
BA c(c,) m 的 扩展 正则 表达 式 所 表示 ， 这 里 c, 是 上 一 段 引 和 人 的 依赖 于 M, 的 常数 ,，c 是 引 理 
1.1 中 的 常数 。 

证 明 : 通过 对 i 归纳 ， 可 知 对 某 个 x 能 找到 一 个 表示 CYCLE (x#) 的 扩展 正则 表达 式 R,, 3X 
里 1 x#l Sgi, m) 且 1 RI sele) mm。 归 纳 基础 i=1， 由 引 理 11.1 显然 成 立 。 可 构造 出 表 
示 CYCLE(x#) 的 长 度 为 cm 的 扩展 正则 表达 式 。 

对 于 归纳 步 ， 假 定 有 表示 CYCLE( x#) 的 扩展 正则 表达 式 Ri,，| RE sela) ^m B E x#| 
之 g(i~-1，m)。 由 上 面 关 于 DTM MM, 的 分 析 讨 论 ， 可 以 构造 长 度 至 多 为 c, 1 RI sela) mij 
扩展 正则 表达 式 R。R 表示 CYCLE(y $), 这 里 | y$ | >2'* 22477 =g(i, m), m 

定理 11.3 令 S(n) 是 任意 的 基本 函数 ， 则 不 存在 S(n) 空 间 界 限 的 [因此 也 没有 S(n) 时 间 
界限 的 ]DTM 以 判别 扩展 正则 表达 式 是 否 表 示 空 集 。 

证 明 : 使 用 反 证 法 。 假 定 空间 界限 为 g(&，n) 的 TMM 可 以 判别 一 个 扩展 正则 表达 式 是 否 表 
示 空 集 。 由 定理 11. 1， 存 在 语言 上 可 被 空间 界限 为 g(k。+1，n) 的 DTMM 所 接受 ， 但 不 能 被 空间 
界限 为 [g(A + 1，n)/n] 的 DTM 所 接受 。 由 假设 ，M, 存 在 ,因此 可 以 设计 一 个 行为 如 下 的 
DTMM, 以 识别 语言 L。 

1. 给 定 长 度 为 n 的 输入 串 w = ala,…a,，MM, 构 造 一 个 长 度 为 dim， 可 表示 至 少 衡 量 尺度 为 
gk +1，n) 的 扩展 正则 表达 式 R,， 这 里 d, 是 独立 于 n 的 常量 。 可 使 用 引 理 11.6 提示 的 算法 来 
构造 Ro 

2. 接着 ，M, 构 造 一 个 扩展 正则 表达 式 R, 以 表示 接受 语言 上 的 g(k。+1,n) 空 间 界 限 的 TMM 
的 有 效 计算 的 集合 。 由 引 理 11. 5, 可 使 1 RI <d, 1 R, 1 ,其 中 d, 是 常数 。 

3. 随后 ，M, 构 造 扩 展 正 则 表达 式 R, 以 表示 衡量 尺度 为 R， 初 始 ID C, = [qa], a bb A 
M 的 有 效 计算 ， 其 中 quM 的 初始 状态 。 即 

R, z2R,Dh, (lga, la, a,b" #) (A, xA,)* 

这 里 是 引 理 11.5 中 的 同 态 映射 ，A, x A, 是 RW, H3113, | Rt «IERI 

dyn, P d, >0 BBR, Alt 
| R| «d,d,n! + dn (11-4) 

4. 最 后 ，M, 将 R, 编 码 为 如 定理 11. 2 中 所 示 的 固定 字母 表 ， 并 使 用 M, 测试 扩展 正则 表达 式 
RR, 是 否 表 示 空 集 。 如 果 答 案 为 是 ， 则 M, 拒 绝 w; 如 果 答 案 为 否 ， 则 用 接受 w。 由 此 MEX E 
BL, 

现在 不 难看 出 第 4 步 是 最 大 的 空间 开销 步 ，M 需 要 空间 g(k。，| R,1 log! R, 1 ) LE Ry 
否 表 示 空 集 。 因 此 ，M, 也 需要 这 样 大 小 的 空间 。 使 用 式 (11-4) 中 R, 的 界限 ， 可 以 看 出 M, 的 空间 
复杂 度 是 S(n) 2 d,g(I,, den’ log n)， 其 中 d, 和 d; 是 常数 ， 原 因 是 对 除 有 穷 个 例外 的 所 有 n, È 
(114) 中 的 第 1 项 即 dd,r* 大 于 第 2 项 dn。 然 而 ， 由 定理 11.2 的 讨论 ， 可 以 说 明 M, 的 空间 复杂 
度 对 于 无 穷 个 n， 其 值 都 超过 (hk +l, n)/n. Alt, WE M, 存 在 ， 则 有 

g(ky +1, n)/n« d,g(k,, dsn’ log n) (11-5) 
对 于 无 穷 多 个 nE., BFE Md RAE, RAAR An, 使 式 (11-5 ) 成 立 ， 对 此 ， 读 者 应 容易 
得 出 该 结论 。 由 此 可 得 她 是 不 存在 的 ， 因 此 ，jM, 也 是 不 存在 的 。 因 此 ， 扩 展 正则 表达 式 的 空 性 
问题 对 于 任意 的 基本 空间 界限 的 图 灵机 是 不 可 判定 的 。 m 


习题 
11.1 称 函数 T(n) 是 时 间 可 构造 的 ， 如 果 存 在 一 个 DTM 计 ， 对 于 给 定 的 长 度 为 n 的 输入 ， 其 在 





O g 在 11.4 PEX 


一 些 可 证 难 的 问题 


*11.2 


*11.3 


*11.4 
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停机 前 恰好 移动 了 7T(n) 次 。 说 明 下 面 的 函数 是 时 间 可 构造 的 。 

a) n 

b)2' 

c) n! 

说 明 每 个 时 间 可 构造 函数 是 空间 可 构造 的 。 如 果 5(n) 是 空间 可 构造 的 ， 则 c “”" 是 时 间 可 
构造 的 ， 其 中 c 是 常 整数 。 

V6 BH n JR. L Bl di — e k AF DTM( NDTM) 在 时 间 7(n) 内 接受 ， 则 存在 一 台 在 时 间 OCT  (n)) 
内 接受 上 的 单 带 DTM( NDTM ) 。 

(DTM 的 时 间 层 次 性 。) 说 明 如 果 T,(n) 和 7T,(n) 是 时 间 可 构造 函数 ， 并 且 





则 DIM 对 某 个 语言 ， 可 在 时 间 7,(n) 内 接受 该 语言 但 不 能 在 时 间 T (n) 内 接受 该 语言 。 


[提示 : 由 习题 11. 3， 只 需要 对 时 间 复 杂 度 为 [7T,(n) 1 的 单 带 DTM 进行 对 角 线 化 即 可 ， 
对 角 线 化 可 在 一 台 多 带 DIM 上 进行 。] 


下 面 两 个 习题 是 关于 弱 形 式 的 非 确定 图 灵机 层次 性 的 。 


** 11.5 


** 11.6 


证 明 对 于 每 个 整数 大 1， 存在 可 被 空间 复杂 度 为 na*"' 的 NDTM 接受 但 不 能 被 空间 复杂 度 为 
的 NDTM 接受 的 语言 。 
对 于 时 间 复 杂 度 ， 证 明和 习题 11.5 相同 的 结果 。 


下 面 两 个 习题 考虑 DTM 的 时 间 复 杂 度 的 紧 致 性 。 


** 11.7 


11.8 


*11.9 


11.10 


* 11.11 


11. 12 
* 11. 13 


** 11. 14 


证 明 每 个 可 被 时 间 复 杂 度 为 7T(n) 的 上 带 DTM 所 接受 的 语言 也 可 被 时 间 复 杂 度 为 0(T (n) 
log T (n) ) I 2 3 DTM 所 接受 。 
使 用 习题 11.7 的 结果 说 明 如 果 T, (n) A T, Cn) FAT TA AT PIG PRG, FL 

at D (n)logT, (n) 

inf T,(n) 

则 DIM 对 某 个 语言 ， 可 在 时 间 T, (n) 内 接受 该 语言 但 不 能 在 时 间 T, Cn) 内 接受 该 语言 。 
说 明 如 果 工 可 被 一 个 空间 复杂 度 为 S(n) 和 时 间 复 杂 度 为 7T(n) 的 DTM( NDTM)M 所 接受 ， 
c 是 大 于 0 的 任意 常数 ， 则 工 可 被 一 个 空间 复杂 度 为 MAX(e S(n) ，n+1) 和 时 间 复 杂 度 为 
MAX(c T(n) ，2n) 的 DTM(NDTM )M 接受 。[ 提示 : M 必须 先 将 M 的 单元 块 浓缩 为 其 自 
身 带 上 的 单一 单元 。] 
说 明 如 果 工 可 被 一 个 时 间 复 杂 度 为 T(n) 的 NDTM 所 接受 ， 则 存在 一 个 常数 “， 使 得 工 可 
被 一 个 时 间 复 杂 度 为 c" ”的 DTM 所 接受 
WT TP EE. FFA 


=0 


T, (n) 
o» T. (n) 
则 RAM 对 某 个 语言 ， 可 在 时 间 T, Cn) 内 但 不 能 在 时 间 T, (n) 内 接受 该 语言 ， 这 里 采用 对 
数 代价 模型 。 
完成 引 理 11. 2 的 证 明 。 
给 定 衡 量 尺度 为 CYCLE(x#) 的 扩展 正则 表达 式 R, ， 构 造 一 个 衡量 尺度 为 CYCLE( (af) * ) 的 
扩展 正则 表达 式 忆 .2 尺 的 长 度 的 界限 必须 是 民 的 长 度 的 常数 倍 。 





=0 


给 定 一 个 0(n) 空 间 界限 的 判别 一 个 半 扩 展 正则 表达 式 是 否 表示 一 个 非 空 集 的 非 确定 算 


o 


CYCLE 应 用 于 字符 串 集 合 的 含义 是 CYCLE 分 别 应 用 于 集合 中 单个 元 素 所 得 的 结果 的 并 。 
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法 。 如 果 尝 试 判别 一 个 正则 表达 式 是 否 表 示 所 有 串 ， 会 失败 吗 ? 为何 必定 失败 ? 
11.15. 给 出 一 个 指数 时 间 复 杂 度 的 确定 型 算法 以 解决 半 扩 展 正则 表达 式 的 补 集 的 空 性 问题 。 
11.16 写 出 引 理 11. 4 中 “格式 错误 ”(format errors) 的 正则 表达 式 。 
11.17 函数 F(n) WELW: F(0) =1, F(n) 227", nzl, F(n) Hoo. (该 函数 在 
4.7 节 中 首次 引入 。) 
*11.18. 给 定 一 个 判别 扩展 正则 集 所 表示 的 集合 是 否 为 空 的 算法 。 算 法 的 时 间 和 空间 复杂 度 为 何 ? 
11.19 ”说明 仅 使 用 算 子 + Aa 的 扩展 正则 表达 式 的 空 性 问题 不 是 基本 的 。 


研究 性 问题 


11.20 本 章 所 提示 的 自然 研究 领域 是 寻找 有 实际 意义 的 、 可 以 证 明 是 难 的 问题 。 这 个 方向 包括 
Fischer 和 Rabin[ 1974 ] 关 于 基本 算术 复杂 度 的 研究 、Cook 和 Reckhow[ 1974 ] 关 于 定理 证 
明 的 研究 以 及 Hunt[1974] 对 于 语言 理论 问题 的 讨论 ， 还 有 文献 和 注释 中 提 及 的 其 他 作者 
的 工作 。 

11.21 另外 一 个 有 意思 的 问题 是 对 于 DTM 的 时 间 层 次 性 以 及 相应 于 NDTM 的 时 间 和 空间 层次 性 
实际 上 是 否 比 习题 11.5、11.6 和 11. 8 所 揭示 的 更 严格 。 例 如 ， 是 否 存在 时 间 可 构造 函 
数 T(n) ， 使 得 没有 语言 可 在 T(n)logT(n) 内 被 识别 但 不 能 在 T(n) 内 被 识别 。 读 者 可 查 
阅 Seiferas, Fischer 和 Meyer[ 1973] 以 了 解 NDTM 的 已 知 最 紧 的 层次 性 。 


文献 和 注释 


图 灵机 的 时 间 和 空间 层次 性 的 广泛 研究 可 见 Hartmanis 和 Stearns[ 1965], Hartmanis, Lewis 
和 Stearns[ 1965] 。Rabin[ 1963 ] 是 关于 时 间 复 杂 度 的 早期 文章 ， 值 得 学 习 。 习 题 11.7 和 11.8 给 
出 的 时 间 层 次 性 的 改进 取 自 Hennie 和 Stearns[ 1966] 。 关 于 非 确定 层次 性 问题 ， 习 题 11.5( 空间 ) 
由 Ibarra[ 1972] 给 出 ， 习 题 11. 6 由 Cook[ 1973] 给 出 。 关 于 RAM 的 层次 性 问题 ,习题 11. 11 由 
Cook 和 Reckhow[ 1973] 给 出 。 习 题 11. 14 WÄ J. Hopcroft, 习题 11. 19 取 自 Meyer 和 Stockmeyer 
[1973], 

对 于 一 些 “ 自然 的 "问题 的 指数 复杂 度 下 界 的 工作 开始 于 Meyer[ 1972] 以 及 Meyer 和 Stockm- 
eyer [1972] 。 关 于 半 扩 展 正则 表达 式 的 定理 11. 2 可 见 Hunt[ 1973b ] 。 关 于 扩展 正则 表达 式 的 定 
理 11.3 可 见 Meyer 和 Stockmeyer [1973 ]。 其 他 关于 难 解 问题 的 工作 可 见 Book [ 1972], Hunt 
[1973a, 1974], Stockmeyer 和 Meyer[ 1973], Meyer[1972], Hunt 和 Rosenkrantz [ 1974] , Rounds 
[1973] 以 及 Constable, Hunt 和 Sahni[ 1974] 。 











第 12 章 ”算术 运算 的 下 界 


设计 求解 一 个 给 定 问题 的 算法 时 最 基本 的 问题 是 “该 问题 固有 的 计算 复杂 度 是 多 少 ?” 了 解 算法 
的 在 有 效 性 方面 的 理论 下 界 ， 可 以 评估 所 设计 的 算法 的 好 坏 ， 以 及 应 再 付出 多 大 的 努力 ， 以 找 出 更 
好 的 解决 方案 。 假 设 已 经 知道 该 问题 是 难 解 的 ， 则 应 该 采用 启发 式 方法 来 寻找 合适 的 解决 方案 。 

遗憾 的 是 ， 确 定 某 个 问题 的 固有 计算 复杂 度 经 常 是 非常 困难 的 。 对 于 大 多 数 实际 问题 ， 往 
往 依赖 经 验 确定 算法 的 好 坏 。 但 是 在 某 些 问题 中 ， 可 以 通过 执行 某 些 计算 需要 的 算术 操作 的 次 
数 来 确定 算法 的 紧 致 下 界 。 本 章 将 分 析 该 本 质问 题 的 一 些 基本 结论 。 例 如 , nxp 矩阵 乘 以 P 维 
向 量 需 要 np 次 标量 乘法 操作 ， 而 求解 x 次 多 项 式 的 结果 需要 n 次 乘法 操作 。 一 些 关 于 下 界 运算 
的 其 他 结论 包含 在 习题 中 。 对 下 界 感 兴趣 的 读者 应 把 习题 作为 本 章 不 可 缺少 的 一 部 分 。 


12.1 域 


为 了 获得 精确 的 下 界 ， 必 须知 道 允 许 的 基本 操作 。 为 了 计算 的 明确 性 ， 假 定 所 有 的 运算 都 
在 某 个 域 中 完成 ， 比 如 实数 域 ， 其 中 的 基本 操作 为 域 中 元 素 的 加 法 和 乘法 运算 。 

定义 ”代数 系统 (A，+ ，，，0，1) 为 域 ， 必 须 满足 

l. 该 系统 为 环 ， 具 有 乘法 单位 元 1。 

2. 乘法 运算 符合 交换 律 。 

3. A - l0] 中 的 任意 元 素 a 存在 乘法 逆 元 a !，, 使 得 aa =a'a=1,° 

例 12.1 采用 普通 加 法 及 乘法 运算 的 实数 构成 域 。 整 数 形成 环 ， 但 不 是 域 ， 因 为 除了 +1 
外 ， 其 他 元 素 不 存在 乘法 逆 元 。 但 当 p 是 素数 时 ， 整 数 模 p 的 运算 则 构成 (有 限 ) 域 。 口 

给 定 x 的 值 ， 考 虑 计算 任意 多 项 式 p(x) = Lia 结果 的 问题 。 希 望 该 算法 以 所 有 a 和 x 的 
值 为 输入 ， 计 算出 多 项 式 p(x) 的 相应 结果 。 该 算法 针对 某 域 的 所 有 可 能 的 输入 值 进行 。 算 法 对 所 
有 允许 的 输入 执行 的 加 法 、 减 法 及 乘法 的 最 大 操作 次 数 称 为 该 算法 的 算术 复杂 度 。 

注意 ， 某 些 n 次 多 项 式 的 运算 比 其 他 多 项 式 计算 要 容易 。 例 如 ,计算 x" +2 LEE log n 次 操 
E, 而 直观 上 “随机 ”n 次 多 项 式 需 要 线性 次 运算 。 因 此 ， 只 用 于 某 些 特定 多 项 式 计算 的 算法 比 通用 
多 项 式 计算 算法 快 。 为 了 得 到 能 够 解决 各 类 多 项 式 的 算法 ， 在 这 里 用 未 定 元 表示 所 有 的 输入 变量 。 

定义 ”代数 系统 的 未 定 元 是 符号 ， 而 不 是 确定 集合 中 的 元 素 。 令 下 =(4，+，，，0，1) 为 
RW, Hx, x, 0o, APART. RR, x. 00s x 对 下 的 扩展 记 为 下 [zx --, xL, 
它 是 满足 如 包含 A4U ix;，…，z%,| 的 最 小 交换 环 (B，+ ，* ,0, 1)。 

注意 ,“ 隐 藏 "单元 与 未 定 元 之 间 是 没有 关系 的 ， 因 此 ， 每 个 多 项 式 的 系数 在 正中， 且 "“ 未 
Rl” WITCH x,, x, °°, xL 表示 Lx, ，…，x,] 中 的 某 些 元 素 。 如 果 运 用 交换 环 的 运算 定律 ， 两 
个 多 项 式 能 够 互相 转换 ， 则 两 个 多 项 式 表示 F[x, ，…，x, ] 的 同一 个 元 素 。F 的 乘法 单元 1， 也 
是 F[x,，…，zx,] 上 的 乘法 单元 。 

例 12.2 令 正 为 实数 域 , 则 环 F[x，y] 包 括 x*,y 及 所 有 的 实数 。 因 为 F[x,y] 在 + 上 是 封 
闭 的 ， 如 x+y 及 x+4 都 在 F[x, ypo BFF, yl ERR LEH, WE (ety) (e+ 


O 通常 情况 下 ， 在 不 引起 混淆 时 略 掉 。 
仿 ” 即 乘法 符合 交换 律 。 
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4) ,根据 环 的 分 配 律 ， 它 等 价 于 x +xy +4% +4y。 口 
12.2 再 论 直线 状 代码 


再 次 考虑 计算 任意 多 项 式 需 要 多 少 次 算术 运算 的 问题 。 我 们 真正 关心 的 是 构造 表达 式 
Lax 或 由 未 知 元 a。，…，a, Mx 构造 等 价 的 表达 式 需要 多 少 次 +A- 操作。 基于 这 些 观察 可 以 
建立 以 下 本 质 上 是 1.5 节 类 似 的 直线 状 程序 模型 的 计算 模型 。 

定义 令 严 为 一 个 域 ， 严 上 的 计算 涉及 以 下 几 个 方面 。 

1. 称 为 给 入 的 未 定 元 集合 。 

2. 变量 名 集合 。 

3. 形 如 abee 的 操作 步骤 序列 ， 其 中 8 为 + 、- 或 * 等 操作 ，a 是 在 前 面 步骤 中 没有 出 现 
过 的 变量 ，5 和 < 为 输入 或 为 正中 的 元 素 ， 或 为 在 前 面 步 又 中 出 现在 箭头 左边 的 变量 名 。 

为 了 方便 起 见 ， 把 cc +0 JR ab, fta—0-b SR a— -5。 计 算 中 出 现 的 下 中 的 元 素 
称 为 常量 。 

为 了 确定 计算 结果 ， 必 须知 道 计算 过 程 中 变量 的 值 。 计 算是 一 步 一 步 地 完成 的 ， 且 每 一 步 
把 FEx,，…，z%,] 中 的 一 个 元 素 赋 给 一 个 新 的 变量 ， 其 中 * 是 输入 。 对 变量 或 输入 a 的 值 v(a) 
可 定义 如 下 。 如 果 a AMARA FP PHT, Wola) =a。 如 果 a PER abe 是 a 在 左边 的 
一 步 , Wola) =0(b) O(c). 

3X E, BPM PFA F[x,，…，x,] 的 表达 式 集合 ， 对 于 EE 中 的 任意 元 素 e， 存 在 变量 了 
使 得 v(f) =e, 

AWB, HARE PROT, I, HE +y, ieit FRR, RRL 
数 时 乘法 运算 次 数 不 计 数 ， 也 需要 两 次 乘法 运算 。 如 果 正 是 复数 域 ， 则 只 需要 一 次 策 法 运算 ， 
BI (x + iy) (x - 坟 )( 不 包括 乘 以 常数 ) 。 通 常 默认 域 为 实数 域 ， 尽 管 也 可 以 用 复数 域 、 有 理 数 域 或 
其 他 有 限 域 。 使 用 的 基本 操作 决定 所 选取 的 域 。 假 设 可 以 表示 实数 ， 对 实数 执行 加 法 和 乘法 运算 
作为 基本 操作 时 ， 则 下 为 实数 域 。 

例 12. 3 回忆 计算 两 个 复数 a+ 记 和 c+id 的 乘法 运算 ， 在 实数 域 下 ， 可 表示 为 两 个 表达 式 
的 计算 : uc - bd 和 ad + be。 计 算 过 程 如 下 ，; 

fit-a tec 
fb *d 
fh -h 
fra*d 
fb*e 
Sorta tf 

AERE f, 的 值 为 ac。 用 类 似 的 方法 可 得 到 v(f,) = bd Mol) 2 ac - bd。 因 此 , f, 的 值 等 于 第 
一 个 表达 式 。f; 的 值 为 ad + bce， 是 第 二 个 表达 式 。 这 个 计算 过 程 可 得 到 两 个 复数 的 积 。 

还 有 另 一 种 计算 两 个 复数 乘法 的 方法 ， 仅 需要 三 次 实数 乘法 操作 : 
ficatb 
fit te 
fad -c 
fia * f, 
fef tf 
fsd +e 
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fib * f, 
fe -hh 
容易 看 出 v(f;) sad «be B v(f,) zac - bd, 0 
明显 看 出 ， 当 且 仅 当 针 对 表达 式 的 输入 用 域 中 的 任意 值 代替 后 得 到 的 是 该 表达 式 的 特定 
实例 ， 然 后 不 断 利 用 输入 值 取 代 中 间 未 定 元 得 到 结果 。 
本 章 的 后 面部 分 主要 考虑 计算 一 系列 表达 式 的 乘法 操作 次 数 的 下 界 。 考 虑 乘法 的 原因 是 在 
某 些 领域 乘法 操作 的 代价 比 加 法 及 减法 大 得 多 。 
例如 ， 在 第 6 章 中 看 到 ， 可 以 用 7 次 标量 乘法 操作 完成 两 个 2 x2 和 矩阵 的 乘法 ， 因 此 得 到 
O(n ) 和 矩阵 乘法 算法 。 事 实 上 Strassen 算法 用 18 次 加 法 操作 在 浙 近 复杂 度 中 可 忽略 不 计 。 在 
Strassen 算法 的 递归 的 第 一 层 中 ，7 次 (n/2) x (n/2) 和 矩阵 乘法 操作 所 需 的 时 间 远 比 18 次 (或 其 他 
次 ) 同类 型 矩阵 的 加 减法 操作 开销 大 (= 趋 于 无 穷 ) 。 
事实 上 ， 如 果 采 用 不 可 交换 环 的 运算 规律 可 在 6 次 标量 乘法 操作 内 完成 两 个 2 x2 EERE, 
那么 不 管 2 x2 和 矩阵 先 法 在 计算 过 程 中 用 了 多 少 次 加 法 及 减法 操作 ， 都 可 以 得 到 O, (n5) 
=0O\(”) 的 矩阵 乘法 算法 。( 已 经 证 明 ， 假 设 和 矩阵 乘法 算法 对 任意 环 适 用 ， 则 2 x2 和 矩阵 乘法 需 
要 7 次 乘法 操作 。 见 Hopcroft 及 Kerr[ 1971] 。) 
另 一 个 实例 为 2 6 节 中 的 两 个 n 位 整数 的 滋 法 可 以 在 0, (n? ) 时 间 内 完成 ， 因 为 3 次 乘法 操作 就 
能 完成 表达 式 ac，bd Mad «bc 的 计算 。 事 实 上 ， 如 果 只 用 2 次 乘法 操作 就 能 计算 这 些 表 达 式 的 值 ， 则 
存在 常数 c， 使 得 M(n) <2M(n/2) +cn， 递 归 应 用 这 样 的 计算 过 程 ， 可 得 到 0, (n log n) 的 整数 乘法 算 
法 ， 该 算法 比 已 知 的 更 好 。 遗 憾 的 是 ， 在 一 些 域 中 ， 这 些 表达 式 的 乘法 操作 不 能 低 于 3 次 。 


12.3 问题 的 矩阵 表述 
许多 问题 可 以 通过 计算 矩阵 与 列 向 量 乘 积 进行 形式 化 。 和 矩阵 的 元 素来 自 Fla, =, a], HPP 
HR, a, ，…，a, 为 中 间 未 知 元 ， 列 向 量 中 的 各 个 元 素 的 中 间 未 知 元 与 c ，…，a, 不 同 。 
例 12.4 Bia ib cid 的 乘法 可 以 采用 矩阵 - 向 量 积 的 方式 表示 
a -byjc ac — bd 
(; a )(a) = ad] 
这 里 下 是 实数 域 ， 和 矩阵 里 的 元 素 选 自 Fla, b] 。 向 量 的 未 知 元 为 c Md, 口 
例 12.5 ZMA EL 的 计算 可 以 表示 为 


(1, x, x, Ut, x”) 


这 里 ESB, 1x (n+1) 和 矩阵 的 元 素来 自 F[x]。 口 
12.4 面向 行 的 矩阵 乘法 的 下 界 


EX SPER, Ha, a SPARER, Ala, =, oAR m eM AES I, 
XCPNIGEOEBF[a, 0, a), $ Fin, RH RRR F, RB Fla, s, 
2,]H] S ER iv, cos, vL] ÆR F” ELE X (linearly independent moduloF") 89, inst F PH 
uy cU, 4, Diet, E F^ cB, BHAA, AE, WAV 不 是 模 F" 线性 无 关 的 ， 称 该 集合 模 
F” 3a X (dependent moduloF" ) 。 

另 一 种 检查 模 E" 线性 无 关 的 方法 是 考虑 在 拨 [a, ，… ,a PORRO APPS RS BILE" [a,, --- 


, 
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a, /F" C4 EX v, - v, Æ F^ PN, 向量 Vv,, v, EF [a,, co, o, PER), RP 线性 无 关 意味 着 
F"[a, » Ut, a, VF" 的 等 价 类 线性 无 关 。 
例 12.6 假定 下 为 实数 域 , 且 a 和 6 为 中 间 未 知 元 ， 则 以 下 三 个 向 量 


2a -a T 
4b | v=| -6 | wz|b-1 
2a -2b b +3 a 


E F'[a, |) PARP 相关 ， 因 为 


-T 
EDENE 1 
3 


另 一 方面 , fe Fm, me . 


e(t eG) 


BRP RACK, BEL, YE F^ p, 则 wb+wa 在 下 中。 由 于 a Mb BREF PAT 
X, WMA u,-u,-0. AS, Hua cub YE FP, PUIA u, Zu, =0。 最 后 得 出 v V, É 
是 模 F 线性 无 关 。 

AUR MdErxpóBEE, EXBEIOUÉOKB F, WM 中 线性 无 关 的 行 的 数目 等 于 1 MMEXJISPIDR 
目 。 但 是 ， 如 果 MM 中 的 元 素来 自 F[a, =, a,], WEP 线性 无 关 的 行 的 数目 不 一 定 等 于 模 FE. 线性 无 关 
列 的 数目 。 例 如 ，1 x3 矩阵 [w a, a, ] 具 有 一 个 模 F 线性 无 关 的 行 和 3 ME F REESE ANT, ERM 
BP 的 行 秩 是 模 严 线性 无 关 的 行 的 数目 。 抢 阵 M IRE. 的 列 秩 是 模 F 线性 无 关 的 列 的 数目 。 

以 下 的 术语 将 在 本 节 后 面部 分 及 后 面 两 节 经 常 使 用 。 

1. F RAM, 

2.{a,, +, a, 和 {x cn, x,| 表示 不 相交 的 中 间 未 知 元 的 集合 。 

3. M 是 rxp 矩阵 ， 且 元 素来 自 F[a,，…, alo 

4. X 是 列 向 量 [%,，…， x]. 

定理 12.1 MATERA Fla, =, a WER, BH X XP SE US, o, xl. BE 
M 的 行 秩 为 r>， 则 计算 Mx 至 少 项 要 7 次 乘法 操作 。 

EA: RRM, Bog MG ABM, 通过 删 掉 多 余 的 行 ， 使 之 只 剩 下 r 个 线性 无 关 的 
FT. OM 为 最 终 的 矩阵 ， 所 有 Mx 的 计算 都 用 M'x 表示 。 最 后 可 得 到 ， 如 果 M'x 需要 7 次 乘法 操 
作 ， 则 Mx 也 需要 r 次 乘法 操作 ) 。 

假定 在 计算 Mx 的 过 程 中 需要 ; 次 乘法 操作 。 令 ce, ，…，e, 为 每 次 乘法 操作 的 表达 式 ， 则 Mx 
的 元 素 可 以 表示 为 e: ，…，e, 的 线性 函数 与 未 知 元 的 和 。 可 以 写 出 

Mx =Ne+f (12-1) 

其 中 e 为 向 量 ， 且 向 量 的 第 i 个 元 素 为 e,，f 为 向 量 ， 其 元 素 为 c Mx, 的 线性 函数 。N 为 rxs 的 
矩阵， 元 素来 自 。 

现在 假定 r>s。 考 虑 线性 代数 里 的 基本 结论 ， 如 果 r>s， 则 NN 的 行 线性 相关 。 也 就 是 说 在 
F 中 存在 yz09 ， 使 得 YN=07。 式 (12-1) 乘 以 yY7， 可 得 : 


yc 








O 以 列 的 形式 给 出 列 向 量 是 不 方便 的 ， 因 此 和 第 7 章 一 样 ， 以 行 的 方式 表示 列 向 量 ， 并 用 上 标 7 表示 转 置 。 

后” 如 果 读 者 不 热 悉 该 结论 ， 即 线性 代数 的 基本 定理 ， 引 理 12. 1 叙述 的 性 质 则 有 着 更 强 的 结论 ， 其 证 明 过 程 足 
以 作为 证 明 当 前 结论 所 需 的 线索 。 

O 0 是 维 数 适 当 的 分 量 全 0 的 向 量 。 
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y Mx xy'Ne« y't-y'f (12-2) 
从 式 (12-2) 可 以 看 出 ，(yYMW)x=yf， 它 是 中 间 未 知 元 的 线性 函数 。 由 于 x 在 每 个 分 量 中 具 
有 不 同 的 未 定 元 ， 因 此 ， 可 以 推断 出 行 向 量 y M 中 的 元 素 仅 来 自 F。 否则 ， 将 有 一 个 项 涉及 未 定 
TE y Mx 中 的 乘法 结果 ， 因 此 为 Yf， 这 与 人 是 未 定 元 的 线性 假定 相 矛 盾 。 由 于 yz0 B y'M 在 
Pop, M 的 依赖 模 严 相关 ， 也 与 假设 相 矛 盾 。 因 此 sor 上 且 定理 成 立 。 口 
例 12.7 12.2 节 曾 考虑 为 一 个 简单 的 整数 递归 乘法 算法 计算 三 个 表达 式 ac，bd 和 ad + be, 

这 三 个 公式 可 以 表示 为 矩阵 - 向 量 的 乘法 : 


a 0 
c 
0 b 12-3 
a) (12-3) 
b a 


令 了 为 实数 域 。 例 12. 6 说 明 式 (12-3 ) PERIT ER R 线性 无 关 的。 因此 ， 计 算 以 上 关于 实 
数 的 三 个 表达 式 需 要 三 次 实数 乘法 操作 。 口 


12.5 面向 列 的 矩阵 乘法 的 下 界 


类 似 定理 12. 1 中 的 线性 无 关 列 的 结果 在 这 里 也 是 成 立 的 ， 但 比较 难 获得 。 在 此 ， 需 要 一 些 
线性 无 关 向 量 的 基本 结论 。 


引 理 12.1 Siv, e, v Amen BMRA, FUP ERI, ARK Fla, |, a,]。 
假定 | v,1 1<i 和 寻 有 9 个 向 量 的 子 集 ， 且 这 些 向 量 是 模 F^ 线性 无 关 的 ， 则 对 于 正中 的 任意 元 素 


b, +, b, REEL wi =v, tby, 2«isk| flr q- 1 个 向 量 的 子 集 ， 且 这 些 向 量 是 模 F^ 线 
性 无 关 的 。 

证 明 : 对 v, v., -“V 进行 重新 编号 ， 如 果 和 需要 ,可 以 假设 {1v,，v,…, w,| Maly, 
v, cs Vua 线性 无 关 。9 

情况 1 假定 |Y,，v,，…, v1 是 线性 无 关 的 ， 则 得 出 {v',，v';，…，v',| 是 线性 无 关 的 。 
为 说 明 这 一 点 ， 假 定 对 于 下 中 ci HETER, Lavi PP, WP = Eb HI, Chic, 
EF h, BÆ, 假如 iv,，v,，…，v,} 是 线性 无 关 的 ， 则 c, 为 0，1 <i<gq。 因 此 入 ,vv'，… 
v i 是 线性 无 关 的 。 

情况 2 BEV, Y, e, Va 是 线性 无 关 的 。 如 果 {v',，v';，…,v',| 是 线性 无 关 的 ， 
则 可 得 结果 ; 如 果 不 是 线性 无 关 的 ， 则 下 中 存在 不 全 为 0 的 c,，…，c,， PBL! cv’ HEF" FP. 
4c 2 XL ,6b, Wi wz Y, cv BH FF. 

HURE c, 40, BMWS! cv, 将 在 F" 中 , Sly, v.s on, Va ARTEXUXIB REF. 
因此 ， 可 以 写 出 下 式 ; 


, 


vc’ (w - Sev.) 
由 于 o ，…，e, 不 全 都 为 0， 因此， 不 失 一 般 性 ， 我 们 假设 c, 头 0。 我 们 再 次 使 用 上 述 的 论 
证 方法 对 集合 fy';，v', e, Voa 进行 证 明 。 假 设 该 集合 是 线性 无 关 的 ， 则 可 以 假设 "div' 
dE F^ n, 其 中 4d, 在 FF 中 且 不 全 为 0。 令 d= 下 db, 则 x=divi+ X5 dv, f£ F^ rp, 如果 
=0， 则 与 1v ，…，v,,i| 线性 无 关 的 假设 相 矛 盾 。 如 果 中 0， 则 可 以 写 出 下 式 : 
| Vi = 4! (x Ș a.) 


”整个 证 明 赂 去 了 “ 模 FIT, 








mE 


由 这 两 个 关于 v, 的 式 子 相等 ， 可 得 : 


d(x- ax) «a (w- Sem) 
PRU SIR REDI. c, d, 并 对 各 项 进行 重新 排列 可 得 
d,c,V, + ITO - c,d,) v, -ed, v, = d,W-¢,x 

由 于 ww 和 x 在 严 中 , 因此 dw-exg 也 在 严 中 。 由 于 c Ald, ERA, Wiw, Y, = 
v ,小 线性 相关 ， 与 假设 矛盾 。 口 

4 1 为 矩阵 元 素来 自 F[a ，…，o,] 的 rxp 和 矩阵， 现在 证 明 ， 如 果 M 的 9 列 是 模 F 线 人 性 无 
关 的 (9>1) ， 则 Mx 的 任意 的 计算 过 程 至 少 需要 9 次 乘法 操作 ， 其 中 x= [xz ，…，x ]7。 

定义 : 如 果 一 个 乘 数值 涉及 未 定 元 x,， 咽 一 个 乘 数 不 是 严 中 的 元 素 ， 则 该 乘法 称 为 活跃 的 。 
例如 ， 如 果 v(5) =3+a,, v(c) 2x, 42 x, WR be c 为 活跃 的 。 FERE, ME (b) =3 且 v(e) 
=x, +2*2,, HUE v(b) =3 +a, Hole) 2a, 42*a,, Wi bc 就 不 是 活路 的 。 

定理 12.2 Sy HREKA Fla, =, aH EOE, RM 的 列 秩 为 9， 则 计算 过 程 
Mx +y 至 少 需 要 gq 次 活跃 乘法 ， 其 中 am, 

证 明 ; 通过 对 9 进行 归纳 来 证 明 。 

归纳 基础 : g=1, EM PARTE TURE Fr" 中 ， 因 此 M 中 存在 元 素 。， 它 在 Fay, =, a] 
中 , (LARGE Fh, A, Mx 中 的 某 个 元 素 对 菜 个 j， 具 有 项 ex, Mx ey 也 同样 成 立 。 没 有 活跃 
乘法 的 计算 过 程 只 能 计算 形 如 PCa, =, a) +L(x,，…，%,) 的 表达 式 ， 其 中 PP 是 多 项 式 , LR 
一 个 线性 函数 ， 每 个 系数 都 在 中 。 因 此， 计算 Mx +y 至 少 有 一 次 活 睹 乘法 。 

Fb: 假定 g>1 且 定 理 对 9 -1 AX. $ CHM +y 的 计算 过 程 。 由 归纳 假设 可 知 ，C 
至 少 有 9 -1>1 KERRE. BE ferh 是 第 一 个 这 样 的 乘法 ， 则 不 失 一 般 性 ， 假 定 

v(g) = Pla,,a,) + Dex, (12-4) 
dtp PERKE FPWR, He, EFH, BU, KREME, BUE c, #0, 

这 时 ， 策 略 是 通过 从 C 和 表达 式 Mx ey 的 集合 中 构造 新 的 表达 式 集合 M's’ + y' 形 成 计算 过 
程 C'，C' 具 有 比 C 更 少 的 活路 乘法。 进一步 ，M' 的 9 -1 列 将 是 模 F 线性 无 关 的 。 因 此 ， 通 过 归 
纳 假 设 ，C' 具 有 4 -1 KERRE, BRECH q 次 活跃 乘法 。 特 别 地 ， 把 C 中 构成 g 的 表达 式 e 
中 的 % 替换 成 0， 而 且 表 达 式 。 可 在 没有 活跃 滋 法 时 计算 出 来 。 计 算 过 程 C' 从 计算 。 开始 ， 表 达 
R e 的 值 赋予 x, (x, 将 不 再 作为 输入 变量 ) 。C' 的 剩余 部 分 由 原来 的 C 中 的 f+-g h RRA f, 
其 他 保持 不 变 。 因 此 ，C' 计 算 的 表达 式 可 以 表示 为 Mx +y’, KB MM' 的 g -1 列 是 模 严 线性 
无 关 的 。 

现在 回 到 证 明细 节 中 ， 从 式 (124) 和 假设 cz0, 可 得 g =0， 条 件 是 下 式 成 立 


x, = 一 en [Po va) 十 > ca, | (12-5) 
iz2 


3 (12-5) 的 右边 是 上 面 提 到 的 表达 式 e。 通 过 前 面 描述 的 C 形成 的 计算 过 程 C' 通 过 把 e BRR x, 
来 计算 Mx +y， 因 此 M'x’ +yY" 可 以 写成 
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可 以 进一步 写成 
P 
-e es -e P(a,, ,9,) 
X) 0 
M à, +M 0 +y (12-6) 
x 0 


考虑 式 (12-6) 中 的 第 一 项 ， 令 M 的 第 i 列 为 m,。 对 于 2<i<p, 3EX m, =m, - (c/c) m. 
4 M's p-1 ER, SB is m, HS x sln, --, 2 ] 。 因 此 ， 式 (126) 中 的 第 一 项 等 于 
M'x', 

x (12-6) WRB —LRSZCSOCK E Fla, =, a, ] fi] RE, ARM 中 的 元 素 在 F[a,, ，…， 
a,] 中 。 因 此 式 (12-6) 中 的 第 2 和 第 3 项 能 够 组 合 形成 新 的 向 量 yY' ， 其 元 素来 自 F[oj，…，a,]。 
因此 ，C' 计 算 M'x! +y'。 从 引 理 12. 1 可 以 直接 推出 MENA q - 1 列 是 模 F 线性 无 关 的 。 

因此 ，C' 具 有 9 -1 次 活路 乘法 ,表明 CRA q KERRE O a an iis ary, 

这 里 给 出 运用 定理 12. 2 的 两 个 例子 。 an an ccc day | dv 

0112.8 把 nxp HH ARK p 的 向 量 v 需要 np 次 标 o7 dp 
量 乘法 。 形 式 地 说 ,对 于 1<isn 和 1<j<p, 令 ay 和 vw 为 未 定 元 ， |. . . ||. 
则 Av 是 如 图 12-1 所 示 的 矩阵 - 向 量 乘法 。 am dm coo aul lv 

直接 对 Av 应 用 定理 12. 1 或 12. 2， 可 得 计算 只 需要 MAX(n, P) goes 
次 乘法 操作 。 然 而 ， 和 矩阵 - 向 量 乘法 操作 同样 也 可 以 表示 为 Mx, K 向 量 乘法 
mh M IBS LIEEROBTE V, son, v, 中 的 (i-1)p+1 列 ~ 记 列 有 
值 ， 其 他 列 为 0。 向 量 x 是 列 向 量 ， 由 4 的 各 行 连接 起 来 形成 。M 和 x 如 图 122 所 示 。 


ayy 

v v v, 0 0 0 0 0 01145 

0 0 0 wy €^ Vs 0 0 0 . 

nif . 
Aap 

0 0 0.00 ...0 Vy Vy vjl > 

np 列 . 

any 

One 

Anp 


图 12-2 IER - 向 量 乘法 等 价 形式 


很 容易 看 出 ，M 的 列 是 模 F 线性 无 关 的 。 通 过 定理 12.2, Av 的 计算 过 程 至 少 需要 np KÈ 
法 操作 。 口 
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例 12.9 En KEFAL ax 的 计算 问题 ， 该 问题 可 以 表示 为 矩阵 - RAK Mx: 


(1, x, x, UU x"] 


a, 

这 里 M 中 元 素来 自 F[x] 且 和 = [ao，c，…，a.] 。 可 以 很 容易 地 看 出 ，M 中 列 的 集合 ( 除 
了 第 一 列 以 外 ) 形 成 一 个 模 线 性 无 关 的 集合 。 因 此 ，M 具有 个 线性 无 关 的 列 ， 计 算 任 意 的 n 次 
多 项 式 需 要 次 乘法 操作 。 

堆 纳 规则 采用 以 下 方案 计算 多 项 式 

(…((ax+a ix a, ,)x t ta )x ta, 

它 需 要 "次 乘法 操作 ， 且 是 经 过 优化 的 ， 需 要 尽 可 能 少 的 乘法 。 采 用 类 似 的 方式 可 以 得 到 
HAD? ox 时 需要 = 次 加 法 或 者 减法 。 因 此 ， 在 某 点 计算 多 项 式 时 运用 堆 纳 规则 所 需 的 算术 运 
算 次 数 是 最 少 的 。 口 


12.6 面向 行 和 列 的 矩阵 乘法 的 下 界 


把 定理 12. 1 和 12. 2 结合 起 来 可 获得 比 单独 考虑 行 和 列 时 更 强 的 结果 。 令 1 Arxp GE, 
元 素来 自 F[a，…，a],，xX=[x，…， 思 ] 。 

定理 12.3 假定 M 具有 子 和 矩阵 $S，S$S 有 9g 行 和 c 列 。 对 瑟 ， 严 中 的 任意 向 量 虽 和 vY， 当 且 仅 
当 u=0 或 v=0 时 ， usSvy 是 下 中 的 元 素 ， 则 任意 计算 Mx 的 过 程 至 少 需 要 49+c-1 次 乘法 操作 。 © 

证 明 : 不 失 一 般 性 , BRMARRA GH, ASA M BB ce WAR, BE M 可 以 在 * KH 
法 操作 内 完成 。 令 e 为 元 素来 自从 乘法 得 到 的 * 表达 式 的 向 量 。 假 定 e 中 第 i 个 元 素 在 第 j 个 元 素 
前 计算 ， 且 i<j， 则 定理 12. 1 可 以 写成 - 

Mx=Ne+f (12-7) 

Ht NETRA FH qx EE, f 是 向 量 , 它 的 元 素 是 a, Ar 的 线性 组 合 。 

根据 定理 12. 1， 可 以 得 出 s 生 gq。 如果 不 是 ， 可 以 找 出 F 中 的 一 个 向 量 yz0, fi y" N =0 7 ， 
表明 y'M PHTREF tH, A, ys 中 的 元 素 也 在 中 ,与 假设 蔬 盾 ( 取 u=y 及 Vv 
=[1, =, 1])。 

由 于 s>d， 可 以 把 N AERA ABEE N, 和 N ， 其 中 入 由 六 的 前 s-q+1l 列 构成 ，N 由 入 的 
后 4-1 列 构成 。 同 样 ， 令 e Me, 分 别 为 e 的 前 s-g+1 个 元 素 和 9g -1 个 元 素 。 可 以 把 式 (12-7) 
写成 


Mx zN,e, * Ne, +f (12-8) 
BUFN,Aqx(q-1), WE F 中 的 向 量 yx0, E yN, =0”。 令 式 (12-8) 乘 以 y ,产生 
y Mx x y'N,e, « y'f (12-9) 


4 M' zy M, 注意，M' 是 个 1 xp ER, CEM 各 行 的 线性 组 合 。 由 于 e 中 的 结果 可 以 在 不 涉及 
e, 的 情况 下 计算 (前 者 假定 先 计算 ) ， 显 然 可 以 得 出 M'x 可 采用 式 (12-9) 并 花费 * -9 +1 次 乘法 
操作 完成 。 如 果 可 以 证 明 MA c 列 是 模 下 线性 无 关 的 ， 则 由 定理 12.2， 有 ss -9q9+1>c， 即 sz>9 
+e-1, WWE. 

现在 证 明 M' = y'M 的 前 e 列 是 模 正 线性 无 关 的 。 令 y -[y,, co, y], MOB c 项 为 
Liay M1 <j<c), MJ M EPIS ijn., BOETETEI BE :+0, CHEKA 3, 0, z Hz 
EFP, ELEL yM EFH, EREN, MRR c PIER FAHOEBS, WW y Sz E Fp, 
与 对 S BB UB. Auk, T4 MA e 列 是 模 王 线性 无 关 的 ， 定 理 得 证 。 口 
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现在 将 定理 12.3 应 用 到 复数 a+ 纺 和 c+id 的 乘法 ， 以 表明 该 运算 需要 3 次 实数 乘法 操作 。 
由 观察 可 得 ， 单 独 采 用 定理 12. 1 和 12. 2 对 于 证 明 这 个 问题 来 说 是 不 够 的 。 
例 12. 10 ”考虑 两 个 复数 e+ 边 和 e+ 记 相 乘 的 问题 ， 即 计算 


"t a 
SSAMAES, OF HRM, BF 
(je af) 
Y: 2 


m ols LC] 


d F PCR, 上 述 的 结果 是 yiziae *ynb 十 y222G — ¥,2,5, 如 果 这 个 表达 式 是 FF 中 的 元 素 ， 则 
a 和 6 的 系数 必须 为 0， 因 此 


EF p, (BE 


yin +yaz =0 (12-10) 
和 
yin - yn =0 (12-11) 
假定 y, 关 0， 则 从 式 (12-11 ) 得 到 z 2y,z/y,, PERAK (12-10), BRU y, BAO 222, 
=0。 由 于 y, 关 0， 可 得 + 六 #0， 则 z=09。 通 过 式 (12-11) 可 得 z,=0。 Az, =z, 20 与 下 面 
的 假设 矛盾 
Zi 
(7 


现在 假定 y, 20, SUR y, =0， 马 上 可 以 发 现 与 假设 矛盾 。 如 果 y, 0， 则 可 调换 y, My, 的 
AE, Wz =z, =0， 与 假设 矛盾 。 

因此 ， 将 定理 12.3 运用 到 Mx 中 ， 其 中 g =c =2, 需要 3 次 实数 乘法 操作 。 例 12. 3 中 的 程序 
表明 使 用 3 次 乘法 操作 足够 了 。 口 

定理 12.1 ~12.3 可 以 推广 到 在 计算 中 使 用 除法 操作 的 情景 。 当 在 运算 步骤 中 使 用 除法 操作 
时 ， 必 须 允 许 在 步骤 中 包括 某 些 值 除 以 0 的 操作 。 因 此 ， 关 于 乘法 操作 的 理论 ( 即 乘 和 除 ) 假定 
域 王 是 无 限 的。 如 果 王 是 有 限 的 ， 可 以 讨论 没有 输 人 的 计算 过 程 ， 因 为 每 个 输入 都 可 能 引起 除 
以 0 的 操作 。 

通过 上 述 修改 ， 定 理 12.1 ~ 12.3 可 以 适用 于 与 乘法 有 关 的 操作 ， 而 不 只 是 乘法 操 
作 。 在 定理 12. 2 中 ， 活 路 来 法 操作 的 定义 .Ag*Ah 或 /8 人 必须 g 和 天 至 少 有 一 个 值 涉 
及 一 个 且 另 一 个 操作 数 不 在 下 中 ; RA gk Fr, 涉及 其 中 的 一 个 x， 且 运算 为 除法 
操作 。 


12.7 MANE 


从 例 12. 9 可 以 看 出 ， 在 一 个 点 计算 次 多 项 式 需 要 n 次 乘法 。 然 而 ， 这 里 有 一 个 潜在 的 假 
设 ， 就 是 多 项 式 采 用 它 的 系数 表示 。 如 果 允 许 使 用 基于 系数 计算 出 来 的 参数 集合 来 表示 多 项 式 ， 
再 来 考虑 多 项 式 计算 所 需 的 最 少 乘法 次 数 。 如 果 需 要 多 次 计算 多 项 式 ， 发 掘 不同 的 多 项 式 表 示 


日 ”注意 下 是 实数 域 这 个 假设 在 这 里 非常 重要 。 
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方式 是 提高 多 项 式 计算 的 一 种 有 效 方法 。 这 种 表示 的 改变 称 为 预 处 理 .2 在 例 12. 9 的 多 项 式 计算 
中 ， 如 果 乘 法 运算 的 一 个 因子 涉及 的 系数 为 a, a, ，…a,， 而 另 一 个 因子 不 在 下 中， 则 称 该 乘法 
为 活 贱 的 。 因 此 ， 如 果 乘 法 的 两 个 因子 数 都 涉及 系数 ， 但 两 个 因子 都 不 涉及 变量 x， 则 该 乘法 可 
直接 计算 。 通 过 预 处 理 ， 所 有 没有 涉及 变量 的 项 都 可 以 直接 计算 出 来 。 

定义 多 变量 多 项 式 的 次 数 为 多 项 式 中 变量 最 大 的 次 数 。 例 如 ，P(x，7y) = xy 的 次 数 
为 3。 
l 下 一 个 引 理 说 明 对 于 任意 v+1 个 bv 元 多 项 式 ， 存 在 非 平凡 的 关于 给 定 多 项 式 ( 其 值 为 0) 的 
多 项 式 函 数 。 例 如 ， 令 p, =, p =x + ， 则 对 于 所 有 x, p, +2p? +p, - p; 70. 

引 理 12.2 Up (x, cc, x), 1 sin, 表示 n 个 多 项 式 。 如 果 n >r， 则 存在 多 项 式 
8(p1，"…，p,)， 它 的 系数 不 等 于 0， 但 是 作为 x, 的 函数 时 等 于 0。 

证 明 ; 令 S, 为 形 如 pip2…p; 的 项 的 集合 ， 其 中 对 于 所 有 的 j, 0<j sd, WIS, | 2(d 1)". 
令 m Jy p, 中 的 最 高 次 数 ， 则 对 于 每 个 ge5S, 是 关于 x,，x,，…， zx, 的 多 项 式 ， 且 次 数 至 多 为 dm, 

次 数 为 dmn 的 r+ 元 多 项 式 可 以 表示 为 长 度 是 (dmn +1) 的 向 量 。 向 量 中 的 元 素 是 各 项 的 系 
数 ， 且 按照 固定 的 顺序 排列 。 因 此 ， 讨 论 多 项 式 的 线性 无 关 性 ， 特 别 是 基于 线性 代数 的 理论 , 来 . 
AS, 中 的 (dm +1) +1 个 多 项 式 的 集合 肯定 线性 相关 即 具 有 一 个 非 平 凡 的 值 为 0 的 多 项 式 
的 和 。 

特别 地 ， 如 果 m, no 为 固定 的 ， 且 m>r， 对 于 足够 大 的 4， 很 容易 证 明 (dL+1) z (dmn 
*1)', BA(d+1)" 是 一 个 在 d 上 比 (dmn +1) 次 数 更 高 的 多 项 式 。 因 此 ， 存 在 一 个 d， 使 得 S, 
的 成 员 的 非 平 几 和 为 x 的 函数 且 等 于 0。 该 和 就 是 所 期 望 的 多 项 式 go 口 

使 用 引 理 12. 2， 可 得 任意 参数 的 集合 来 表示 一 个 多 项 式 ， 则 需要 n+ 1 个 参数 表示 任意 的 nm 
次 多 项 式 ， 而 该 多 项 式 的 系数 是 参数 的 多 项 式 函 数 。 

引 理 12.3 EMAA n ERKATZEA C^ 到 r 维 参 数 向 量 空间 D' 的 一 对 一 上 喘 射 。 如 果 
M'E C 中 一 个 向 量 的 每 个 元 素 是 D 中 相应 向 量 的 元 案 的 多 项 式 函数 ， 则 ran, 

证 明 : 假定 r<n HREM: c -p,(d, =, d), HP p, 为 多 项 式 ，d 是 参数 ，c, HK 
数 。 通 过 引 理 12. 2， 存 在 非 平 凡 多 项 式 g， 使 得 对 于 d; 的 所 有 值 ，g(c,，…，c,) 等 于 0。。 由 于 g 
本 身 不 等 于 0， 则 存在 系数 为 c, ，… ，c, 的 多 项 式 ， 使 得 g(c,，…，c,) 不 是 0。 因 此 ， 多 项 式 不 
能 表示 为 的 形式 ， 矛 盾 。 口 

现在 说 明 尽 管 采 用 了 预 处 理 ， 但 计算 n 次 多 项 式 至 少 还 需要 n/2 次 乘法 操作 。 

定理 12.4 即使 不 计 计算 过 程 中 仅 涉及 系数 的 乘法 操作 ， 任 意 nn 次 多 项 式 在 某 点 的 计算 这 
程 至 少 才 要 n/2 X EHE, 

ER: 假定 存在 一 个 需要 m 个 乘法 步 又 的 涉及 未 知 量 x 的 计算 过 程 。 令 乘法 的 结果 是 表达 
Ah» foots far WETS TARRY 

f z[L, 4K, oy fiis x) +B] * [LG ey firs x) +B,; | 
其 中 每 个 忆 都 是 f 和 x 的 线性 函数 ， 每 个 B, 是 系数 的 多 项 式 函 数 ， 则 多 项 式 p(x) 的 计算 可 以 表 
示 为 
P(x) -L.aAG, o> fx) + Boast 

因此 ，P(x) 可 以 表示 为 2m +1 个 参数 B, 的 新 集合 ， 进 而 ,， p(x) 的 系数 是 B, 的 多 项 式 函数 。 

由 引 理 12.3， 有 ?2m «12n«1, BI mmn/2, Li 


O 注意 这 里 的 情况 和 8. 5 节 的 情况 不 同 ， 那 里 关于 一 个 多 项 式 的 所 有 计 值 点 都 是 已 知 的 。 这 里 仅 可 以 在 计 值 前 预 
先 处 理 系数 ， 而 每 次 进行 一 次 计 值 ， 即 计算 是 在 线 的 而 非 离线 的 。 
O 注意 & 是 系数 为 ci 的 多 项 式 ， 因 为 “是 系数 为 MERA, BK g 也 是 系数 为 十 的 多 项 式 。 
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定理 12.4 给 出 一 个 多 项 式 在 某 点 使 用 多 项 式 的 预 处 理 计算 所 项 要 的 乘法 次 数 的 下 界 。 把 
多 项 式 重新 表示 ， 使 其 可 以 在 n/2 次 乘法 操作 内 完成 的 问题 具有 很 大 的 意义 。 在 这 个 问题 中 ， 不 
仅 要 找 出 容易 计算 的 参数 集合 ， 同 时 还 项 给 出 从 系数 计算 出 参数 的 方便 方法 。 因 此 ， 我 们 期 望 参 
数 是 系数 的 有 理 函 数 ， 而 寻找 这 样 的 参数 的 技术 会 在 习题 中 提 及 。 


习题 


BF AM, x 是 未 知 变量 。 证 明 变量 为 *， 系 数 来 自 下 的 多 项 式 集合 形成 一 个 交换 环 F[x]， 
T FIBER IURE F[x] 中 的 乘法 单位 元 。 
证 明 对 以 下 表达 式 的 计算 
ac +bd 
ac — bd 
be + ad 
be -ad 
至 少 需要 4 次 乘法 操作 ， 其 中 a, b,c 和 4 来自 域 P。 
证 明 计算 列 向 量 与 行 向 量 的 乘积 


至 少 需 要 mn 次 乘法 操作 。 

设 二 元 x My 的 mn 次 多 项 式 为 Z)-。Z /oayxyY。 证 明 对 于 基于 预 处 理 的 该 多 项 式 的 求 值 ， 
(n+1)(n+2)/2 -1 次 乘法 操作 是 充分 且 必 要 的 。 

证 明 2 x2 特 普 利 芯 和 矩阵 ( 见 第 6 章 的 习题 ) 乘 以 向 量 


b cird 

La alle 
需要 3 次 乘法 操作 。 
对 习题 12.5 进行 推广 证 明 n x n HERE A PR ERO EEZ 2n -1 次 乘法 操作 。 假 设 n= 
3， 如 何 得 到 界限 ? ` 
对 2.6 节 中 的 乘法 算法 进行 推广 ， 把 乘 数 和 被 乘 数 分 别 划分 成 3 块 ， 然 后 再 用 尽量 少 的 乘 
法 ， 计 算 以 下 矩阵 - 向 量 乘积 ， 一 共和 需要 多 少 次 乘法 操作 ? 相应 2. 6 节 中 的 算法 ， 这 种 方 
法 有 改进 吗 ? 


oo oA 
coo 8 c 
>a o 
rm 
~oe A 
LLL 1 


0 
SFHR, Sa, s, a, Rx, +, x, 为 两 个 互 不 相交 的 未 定 元 集合 , 令 x = [zi ，…， 
x] HMArxp BB, KUGURCKB Fla, co. 2,], RA q 个 模 严 线性 无 关 的 列 。 证 
明 对 x 进行 预 处 理 ， 例 如 ， 不 对 仅 涉 及 x 的 项 进行 计算 ， 说 明 计算 Mx 仍然 需要 9/2 KR 
法 操作 。 
假定 集合 已 恰 含 有 上 大 个 单 乘法 表达 式 ， 不 存在 是 常数 的 线性 组 合 (此 如 对 于 未 定 元 a Ail b, 
它们 是 a * 6) ， 假 定 q 次 乘法 运算 就 足以 计算 已 中 的 所 有 表达 式 。 证 明 存在 一 个 包含 4 次 
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乘法 的 过 程 ， 其 对 个 己 中 的 可 以 通过 单 乘法 计算 的 表达 式 进行 计 值 。 

*12.10 证 明 : 至 少 需要 3 次 乘法 操作 来 完成 表达 式 ac 和 be + ad 的 计算 [提示 : 采用 12.9 的 结 
i£l. 

*12.11 EH: 至 少 需要 3k 次 乘法 运算 以 完成 有 k 个 表达 式 的 集合 的 计算 ， 其 中 表达 式 形 如 : 
asc; fl bc, a,d,, RP aeisk, 

习题 12. 12 ~ 12.14 涉及 两 个 2 x 2 B PE A 和 B 相 乘 的 问题 。 希 望 采用 非 可 交换 乘法 计算 AB 
乘积 中 的 四 个 表达 式 : 
a, 05 u ou anbu +425, aub, tanby 
| ay M ; ba ME | anaba tanba anbat M 

** 12. 12 Wl. MURIS EHE AER AS. 需要 4 次 乘法 的 操作 ， 则 存在 另 一 个 计算 ， 采 用 9 次 

乘法 操作 ， 且 适用 于 整数 模 2 的 环 ， 这 里 所 有 的 乘法 采用 形式 
(a, ta, * a, Ji) * Cban tOna o +5,,) 

*12.13 TERR: 如 果 乘 法 的 左边 是 如 上 道 习题 中 的 单个 a( 例 如 k=1)， 则 计算 至 少 和 需要 7 次 乘法 
操作 。[ 提示 : Sa, =0, 采用 习题 12. 11 取 k=2 HAR.) 

**12.14. 证明 : 如 果 左 边 不 存在 单个 的 of ， 则 还 需要 7 次 乘法 操作 来 完成 。[ 提示 : 证 明 对 每 种 情 
况 ， 都 有 一 个 条 件 的 集合 ， 例 如 cy =0 或 者 au = aw， 使 得 其 中 一 个 乘法 等 于 0， 剩 下 的 
计算 就 是 解决 习题 12. 11 针对 k=2 的 情况 。] 

林 12. 15 证 明 ; 2 x2 XBEESEDL2 xn 矩阵 需要 「7n/21] 次 乘法 操作 。 

*#12.16 给 出 一 个 采用 mm +m n 次 乘法 操作 的 mx2 和 矩阵 乘 以 2 xm 抢 阵 的 算法 ， 假 定 标 量 乘法 
形成 交换 环 。 把 这 个 结论 与 习题 12. 15 的 技术 相 结合 ， 证 明和 矩阵 乘法 在 不 可 交换 情况 下 


需要 更 多 的 乘法 操作 。 
定义 RXS, Ha, =, a, 1b, 5, b, 为 两 个 不 相交 的 未 定 元 集合 。 双 线性 型 是 
如 下 形式 的 表达 式 
Y rua, 
EP rA R 中 的 元 素 。 


**12.17. a) 证 明 对 于 任意 双 线 性 型 的 集合 都 存在 一 个 计算 过 程 ， 其 需要 最 少 的 乘法 次 数 ， 且 所 有 
的 乘法 介 于 a 的 线性 函数 及 45 的 线性 函数 之 间 ，; 
b) 证 明 存 在 最 小 的 关于 乘法 运算 的 计算 过 程 ， 每 个 乘法 计算 都 介 于 o BO ARTE PRÉC. b 的 
线性 函数 之 间 ( 注 意 : 如 果 把 这 部 分 限定 在 交换 环 时 ， 这 个 结论 不 成 立 ) ; 
c) 给 定 普通 的 允许 除法 操作 的 计算 过 程 ， 证 明 存 在 一 个 计算 过 程 其 需要 最 少 的 乘法 操 
作 ， 而 且 不 需要 使 用 除法 操作 。 

林 12.18 令 尺 为 不 可 交换 环 ， 且 令 a，b 和 x 为 未 定 元 的 列 向 量 [c =, anl’, (b,, -, 6,] 和 
[x, +, x lo OX Ax, 的 线性 和 的 矩阵 。 习 题 12. 17 表明 计算 双 线 性 型 的 集合 (a7X)7 
可 以 表示 为 

M(Pa * Qx) 
其 中 M, PAO GUB FHER, CLRAKRBA(aX)’ HENRHRARRES 
(b7X")", 定义 M( Pa - Ox) 的 已 对 倡 操 作为 集合 PZ(HMmb . Qn. W (a7 X)" 的 任意 计 
. 5B PXHBTEM (a7 X)" 的 左 对 偶 。 

*12.19 ”证 明 非 交换 环 上 的 m x n REAR n x p SER BT AG AY BED FRE BE HE VOBOB Fon x m X BE 
FEU mx p 矩阵 。[ 提示 : 采用 习题 12. 18 的 结论 。] 
目前 为 止 的 习题 包括 了 代数 操作 数目 下 界 的 材料 ， 后 面 的 练习 包括 更 为 通用 的 性 质 ， 问 
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* 12. 20 


** 12. 21 


** 12.22 


** 12. 23 


** 12. 24 


* 12. 25 


* 12. 26 
* 12. 27 


** 12. 28 


题 12.20 ~ 12.23. 与 矩阵 转 置 相关 。 对 1 <i, jen, 令 ay 为 未 定 元 。 考 虑 一 个 计算 模型 ， 
每 个 变量 是 未 定 元 的 n 元 组 ,计算 步骤 ac-b&e 赋值 给 n 元 组 的 a 个 未 定 元 ， 由 出 现在 6 
EX c 的 未 定 元 中 选择 。n 元 组 4 或 e MARE, 
证 明 任意 元 组 集合 的 计算 

{(a,, «+, an) | 1 isn] 
Ui (ay, 7, an) l 1<ign| 作 为 输入 集合 ， 至 少 需 要 n logn 步 。[ 提示 : 对 任意 的 i 
j, S 5 为 出 现在 一 个 包含 as 的 n 元 组 中 下 标 为 j 的 未 定 元 的 最 大 数 , Of = 之 2 log s; , 
考虑 当 计算 步骤 变化 时 了 的 变化 。] 
把 计算 过 程 的 步骤 限制 为 形式 abec, HH o 由 中 循环 移 位 选择 的 n/2 个 未 定 元 及 从 c 
的 余 码 位 置 中 获得 n/2 个 未 定 元 。 寻 找 计算 过 程 在 O(n log n) 时 间 内 计算 12. 20 的 练习 。 
设 6 为 一 个 有 向 无 环 图 , 其 有 n 个 已 知 源 顶 点 (没有 输入 边 的 顶点 ) 和 nn 个 输出 顶点 (没有 输 
出 边 的 顶点 )。 令 工 和 了 分 别 为 源 顶 点 与 输出 顶点 的 子 集 ， 令 G( 了 ,了 ) 为 包含 从 XX 的 顶点 
到 工 的 顶点 的 路 径 上 所 有 有 向 边 形成 的 子 图 。C(XE， 了 的 容量 为 分 裂 王 了 所 需 移 除 的 最 少 
顶点 数 ( 与 人 边 和 出 边 数 )。 假 定 任意 的 X，Y 和 图 G(X, Y) 具有 容量 MIN (XI, 
IYI), ERISTA n, FEA cn log n 条 边 的 图 6， 其 中 < 是 一 固定 的 常数 。 
移 相 网 络 (shifting network) 是 有 个 输出 顶点 ， 编 号 为 0 ~ -1,， 个 输出 顶点 ， 编 号 为 0 
~n- 的 有 向 图 ， 对 任意 的 0<s<n -1， 存 在 一 系列 不 相交 的 由 i 源 顶 点 入 ， 从 输出 i+ 
s 顶点 模 n 出 的 路 径 集 合 。 
a) 证 明 对 任意 nn， 存 在 一 个 移 相 网 络 ， 其 具有 2n log n RU; 
b) 证 明 对 移 相 网 络 ， 浙 近 地 需 要 n log n Ki; 
c) 证 明 可 以 用 移 相 网 络 计算 矩阵 的 转 置 。 
定义 ” 令 下 为 一 个 域 ，xi，%，,，…，%, 为 未 定 元 ， 线 性 计算 是 如 下 形式 的 步骤 序列 : a 
A1b+Asc， 这 里 a 是 变量 ,6b 和 c 是 变量 或 者 未 定 元 ,和 A 和 和 ;为 下 的 元 素 ， 称 为 常量 。 
令 玉 为 复数 域 , 令 4 为 元 素 取 自 忆 的 矩阵 且 x=[x,，…，x,]”。 证 明 Ahx 的 任意 线性 计算 
需要 log[ det( 4) ]/log(2c) 步 ,其 中 < 为 出 现在 计算 过 程 中 的 任意 常数 的 最 大 模 °。 
证 明 对 [x, ，…，x,] 进 行 侍 里 叶 变 换 的 线性 计算 过 程 ， 其 常数 的 模 小 于 等 于 1， REL 
nlogn 步 。 
以 下 6 个 问题 主要 考虑 实现 布尔 函数 所 需 的 两 输入 门 的 最 小 数量 。 
证 明 任意 = 个 变量 的 布尔 函数 可 以 至 多 使 用 双 " 个 两 输入 的 门 电路 实现 。 
证 明 对 于 任意 rn， 存在 具有 个 变量 的 布尔 函数 ， 使 得 它 的 实现 至 少 大 约 需 要 2"/n 个 两 
输入 的 门 电路 。 
目前 对 特定 布尔 函数 的 实现 复杂 度 的 了 解 甚 少 ， 但 是 ， 若 假设 将 实现 限制 在 树 这 样 的 网 
络 中 ， 可 以 证 明 某 些 函 数 需要 n /logn 个 门 电路 。 证 明 以 下 条 件 足 以 说 明 具 有 个 变量 的 
布尔 函数 需要 n /logn 个 门 电路 。 
条 件 : 令 f(x,，…，x,) 为 具有 nn 个 变量 的 布尔 函数 。 把 %, 划分 成 为 b=n/log nth, HR 
具有 logn SEB. WO 或 1) 给 5 -1 块 中 的 各 个 变量 ， 总 共有 2"/n 种 赋值 方式 。 结 果 
得 到 具有 logn 个 变量 的 布尔 欧 数 ， 其 是 2" 个 具有 logn 个 变量 的 布尔 函数 之 一 。 所 得 的 实 


际 冰 数 取 决 于 给 -1 块 变量 所 赋 的 值 。 令 B, 为 设置 为 非 零 的 块 。 如 果 B, 中 变量 的 2"/n 


O a+bi 的 模 是 Vai +b, 
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*# 12. 29 


* 12. 30 


12.31 


** 12. 32 


** 12, 33 


** 12, 34 


#h Ë 


种 不 同 函数 可 以 通过 对 其 他 变量 赋予 适当 的 0 和 1 而 得 。 还 要 假设 对 于 任意 的 i 上 述 陈 
人 1<i<log mn， 则 任意 针对 /的 树 形 网 络 需 要 n^ /log n 个 门 电路 。 
4 mz2-*logn, 4t, 1! 1xisn/m, L<j<m| X0- 1 值 的 m 维 向 量 的 集合 ， 其 中 每 个 
t; 至少 有 两 个 记分 的 信 为 令 
fx. xn. o Aun) 7 LED Fi B - II zu | 


l<icm 
such that t= 1 


其 中 性 为 i, 的 第 /个 成 分 , 证 明 采 用 树 形 网 络 实现 f 至 少 需要 wv/log n 个 门 电路 。 
构造 其 他 的 布尔 函数 ， 若 以 树 形 网 络 实现 它们 分 别 需 要 (a)m2 个 门 电路 和 (b)m /logn 个 
门 电 路 。 . 

4 S, (x, on, zx, ) 为 对 称 布尔 函数 ， 当 且 仅 当 i 个 x MHA, CHATE L. 

a) 给 出 一 种 有 尽 可 能 少 的 两 输入 门 的 S, (x, ，…，x, ) 的 实现 方法 ; 

b) 寻 找 一 种 S,(x,, c, x,) 的 树 形 实现 ， 其 采用 尽 可 能 少 的 两 输入 门 。 

例 12.9 已 经 证 明了 计算 任意 的 n 次 多 项 式 需要 n 次 乘法 操作 。 试 给 出 一 个 只 需要 KR 
法 的 系数 为 实数 的 nn 个 变量 的 特别 多 项 式 。 

证 明 对 于 由 正 整数 构成 的 含有 MIN 操作 和 + 操作 的 半 环 上 的 和 矩阵 乘法 需要 en? 次 操作 ， 
其 中 常数 c 满 足 0 <c<1。 

证 明基 于 AND 和 OR 运算 的 布尔 矩阵 的 乘法 需要 n 次 操作 。 


习题 12. 35 和 12. 36 主要 考虑 多 项 式 的 表示 ， 使 多 项 式 的 计 值 大 约 能 在 n/2 次 乘法 操作 内 完成 。 


** 12.35 


** 12. 36 


令 P(xz) 为 王 次 多 项 式 ， 其 中 是 奇数 且 大 于 1， 表示 为 以 下 形式 
p(x) x (à! - a)q(x) *bx «c 
a) 证 明 存 在 合适 的 a, 使 得 b=0; 
b) 证 明 存在 合适 的 a, 和 8pB,， 使 得 p(x) 可 以 表示 为 
P(x) 2 (X - aD [G3 -a)[] +6] +B, 
因此 ， 用 o; MB 表示 的 p(x) 的 计算 可 以 在 Ln/2」+2 次 乘法 操作 内 完成 ; 

c) 在 (8) 中 oa; 可 能 是 复数 ， 这 种 困难 应 该 如 何 处 理 ? [提示 : 选取 某 个 合适 的 c， 用 y+e 
THR p(x) PK x, RE x =x 处 计算 p(x) ， 而 是 在 y =x, -e 处 计算 多 项 式 p'(y)。] 
习题 12.35 并 没有 提供 方法 计算 a, Bb, a 有 可 能 不 是 有 理 数 。 下 面 的 问题 主要 研究 

如 何 克 服 这 些 困难 。 
S m HER, Ml<l<m, > 
(m - D « (10-1)! +3m+41 
ne 2 


IBI r,=m-l+j+1, l<j<l, La 和 8 为 参数 定义 一 个 计算 链 ， 形 式 为 
Ca (x)——(x^" 十 Gd ) (x^ +B,) 


ca (x) —(e, * a5) (x* * B5) 


cala) (ct +a) (x +B;) 
4 p(x) = Zics(x)。 
a) HERA x 最 高 次 数 的 系数 取决 于 芝 1_jrs 给 出 的 as， 同时 x 最 高 次 数 的 系数 也 取决 于 4-。 
ry -rA hÉ Bs 
b) 证 明 所 有 的 多 项 式 次 数 小 于 等 于 m(m +1) +1， 也 就 是 领先 的 系数 可 以 被 m(m+1) +1 
个 参数 表示 ， 其 满足 (i) 多 项 式 可 以 在 m(m+1)/2 +0(m) 次 乘法 内 从 参数 计算 出 来 ; - 
(ii) 参 数 是 系数 的 有 理 函 数 。 
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研究 性 问题 


对 于 线性 状 结构 的 程序 中 ， 可 使 用 有 向 无 环 图 与 其 关联 。 图 的 顶点 表示 输入 和 变量 。 假 设 
fg * 上 为 一 个 步骤 ， 则 存在 一 条 从 g 到 /及 六 到 /的 有 向 边 。 观 察 程序 执行 的 步骤 数 恰 好 等 于 边 
数 的 两 倍 。 因 此 ， 从 程序 得 到 的 有 向 无 环 图 的 边 数 的 下 界 也 给 出 了 问题 线性 状 程序 执行 步骤 的 
下 界 。 

12.37. 对 于 大 的 n， 证 明 每 个 具有 个 源 顶 点 和 nn 个 输出 顶点 、 满 足 习 题 12. 22 容量 条 件 的 有 向 
无 回路 图 至 少 有 n log n 条 边 ， 或 者 给 出 反例 。 

12. 38 由 中 个 ”位 整数 (假定 采用 按 位 计算 ) 相 采 的 线性 状 程序 所 产生 的 每 个 图 满足 习题 12.22 
中 的 容量 条 件 吗 ? 


文献 和 注释 


定理 12. 2 及 本 节 所 描述 问题 的 通用 公式 方法 取 自 Winograd[ 1970a] 。 定 理 12.1 和 12.3 取 自 
Fiduccia[ 1971] 。 如 果 没 有 除法 ，n 次 多 项 式 的 计算 需要 n 次 乘法 操作 ， 该 结论 来 自 ( Knuth) 
[1969] A. Garsia, Pan[ 1966] 把 该 结论 扩展 到 乘法 运算 。Motzkin[ 1955 ] 证 明了 经 预 处 理 后 多 项 式 
的 计算 需要 | "2 ] + 1 次 乘法 操作 。Ostrowski[ 1954 ] 在 这 个 方向 做 了 一 些 初步 的 研究 。Winograd 
[1970b] 证 明了 对 于 复数 乘法 至 少 需 要 三 次 乘法 操作 。 

习题 12. 7 由 Winograd 提出 [1973 ] 。 关 于 和 矩阵 乘法 问题 下 界限 的 材料 (习题 12.9 ~ 12. 16) 取 
H Hopcroft 和 Kerr [1971], 3 Ef 12.17 的 结果 来 自 多 个 人 的 独立 研究 。 其 中 e 部 分 归功 于 
S. Winograd 和 P. Ungar 的 私人 信件 。 习 题 12. 18 和 12. 19 取 自 Hopcroft 和 Muszinskif 1973 ] 。 习 题 
12. 20 ~ 12. 22 及 习题 12. 37 和 12. 38 则 基于 R. Floyd 的 讨论 。 习 题 12. 24 及 12.25 RHA Morgen- 
stern[ 1973], ， 习 题 12. 28 和 12.29 BRA Neciporuk[ 1966], ， 习 题 12.30(a) KRG Harper 和 Savage 
[1972] 。 习 题 12. 32 取 自 Strassen [ 1974] 。 习 题 12. 33 取 自 Kerr[ 1970] 。 习 题 12. 34 取 自 Pratt 
[1974]。 习 题 12. 35 取 自 Eve[1964], 。 习 题 12. 36 HLA Rabin 和 Winograd[ 1971] 。 

关于 求解 算术 运算 下 界 的 其 他 文献 可 参阅 Borodin 和 Cook[ 1974] 和 Kedem[ 1974] 。 


附录 A 算法 的 C/C++ 代码 


本 书 使 用 一 种 称 为 dgin ALGOL 的 语言 来 描述 算法 。Pidgin 意思 是 “由 两 种 或 多 种 语言 混合 
而 成 的 一 种 简化 的 说 话 方式 ， 语 法 和 词汇 较 初 等 ， 用 于 不 同 语言 者 进行 交流 ”。 算 法 的 开发 可 分 
为 设计 、 分 析 和 实现 三 个 环节 ， 该 过 程 可 能 不 断 重复 ， 直 到 需求 满足 。 一 般 说 来 ， 算 法 的 描述 只 
要 清晰 明了 就 可 以 了 。 书 中 所 用 的 Pidgin ALGOL 语言 对 于 算法 描述 很 充分 ， 但 ALGOL 是 一 个 比 
较 古 老 的 语言 ， 如 果 读 者 想 测试 书 中 给 出 的 例子 ， 要 找到 一 个 ALGOL 语言 的 编译 器 是 一 件 不 容 
易 的 事 ( 译 者 推荐 PLT Scheme 带 的 ALGOL 语言 解释 器 ， 读 者 可 参阅 本 书 译 者 的 另 一 本 译作 《程序 
设计 方法 》 ， 人 民 邮 电 出 版 社 2003)。 因 此 ， 在 翻译 本 书 的 时 候 ， 经 和 机 械 工 业 出 版 社 协商 ， 决 
定 本 书 的 代码 保持 原貌 ， 另 将 书 中 的 算法 以 C/C++ 实现 作为 译本 的 附录 ， 希 望 对 读者 有 所 帮助 。 

本 附录 包括 了 本 书 近 40 个 算法 的 C(C++ ) 代 码 。 

读者 可 依据 GNU 通用 公共 授权 条 款 规定 ， 发 布 与 /或 修改 本 代码 ; 代码 系 基于 教学 目的 而 发 
布 ， 不 负 任 何 担保 责 任 ; 亦 无 对 适 售 性 或 特定 目的 适用 性 所 为 的 默 示 性 担保 。 详 情 请 参照 GNU 
通用 公共 授权 。 

代码 编译 运行 环境 Windows 98/XP, DevC++ 或 其 他 支持 ISO C/C++ 标准 的 编译 器 ， 
Linux/Unix, GCC 或 其 他 支持 ISO C/C++ 标准 的 编译 器 。 

说 明 ， 本 附录 所 有 代码 都 在 Dev-C++ Version 4.9.9.2 下 测试 通过 。Dev-C++ 是 一 个 免费 的 ， 


几乎 完全 支持 BO C/C++ 标准 的 C/C++ 程序 集成 开发 环境 。 下 载 地 址 为 http: // 
www. bloodshed. net/devcpp. html, 


使 用 方法 和 测试 用 例 见 程序 注释 。 
Al ir mimm 


#include <iostream> 
#include < stdlibh> 


using namespace std; 
// 功能 : Nn in KA 
// 输入 : n 
// 输出 : naka 
// 测试 数据 : 
// 输入 5 
// 测试 结果 : 
// 输出 5* =3125 
int nPowerN() 
( 
int rl; 
cin >>rl; 
if (rl < =0) 
{ 
cout << 0; 
} 
else 
{ 
int r2 -r1; 
int r3 =rl-1; 
while(r3 >0) 
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r2 =r2* rl; 
r3 =r3 -1; 


) 
cout «« r2; 
} 
return 0; 
} 
int main () 
{ 


nPowerN():; 


system ("Pause"); 


return 0; 


识别 具有 相同 数目 的 1 和 2 的 字符 串 的 程序 
tinclude cotdlib h> 


using namespace std; 


// 检查 一 个 输入 数字 流 中 的 1 和 2 的 数目 是 不 是 相等 


// 数字 流 以 0 为 结束 
// 输入 : 


// Console 输入 一 个 只 包含 1 和 2 的 数字 流 ， 数 字 流 的 输入 以 0 结束 


// 输出 : 


// return bool 值 ， 如 果 数 字 流 中 1 的 数目 和 2 的 数目 相等 ， 返 回 crue 
// 和 否则， 返回 false 


// 测试 数据 : 


// 112221222211110 


// 测试 结果 ; 
// true; 
bool checkEqual () 
{ 
int x=0; 
int d=0; 
cin >>x; 
while (x! =0) 
{ 
if (x! =1) 
{ 
d-i 
) 
else 
t 
de; 
) 
cin»»x; 
} 
if (d ==0) 
{ 


cout <<1; 


return true; 


} 

return false; 
} 
int main () 
{ 


checkEqual(); . 
System("pause"); 


return 0; 
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A. 3 中 序 遍 历 的 递归 和 非 递归 过 程 


#include < iostream > 
#include «stack» 


using namespace std; 

const int EmptyPosition = -1; 

// 原 书 图 2-9、 图 2-10, 

// 树 的 中 序 遍 历 (运用 递归 ) 

// 9^: 

// vertex: 开始 中 序 遍 历 的 顶点 

// leftson: 数组 ， 用 来 记录 每 个 顶点 的 左 儿 子 顶点 

// rightson; 数组 ， 用 来 记录 每 个 顶点 的 右 儿 子 顶 点 
// number: WA, ARICRETHA PHRASES 


// 测试 函数 : 

// void testInorder() 

// 测试 数据 : 

H 输入 以 下 树 

// 1 

// / oN 

// 2 

// / \ /N 
// 3 4 7 8 
// \ \ 
// 5 9 
// 测试 结果 : 

// HERDAR: 

// 324517689 


void inorder(int vertex, int* leftson, int* rightson, int* number, int countNode) 
( 
Static int count =1; 
if (vertex > = countNode l| vertex <0) 
( 
return; 
) 
if(ieftson[vertex]! =EmptyPosition) 
{ 
inorder (leftson[vertex], leftson, rightson, number, countNode); 
} . 
number [vertex] = count; 
cout << vertex <<" Vt"; 
count ++; 
if(rightson[vertex]! = EmptyPosition) 
( 
inorder(rightson[vertex], leftson, rightson, number, countNode); 
} 
} 
// 不 使 用 递归 的 树 的 中 序 遍 历 算法 实现 。 
// RIA: 
root: ”开始 中 序 遍 历 的 树 顶 点 。 
leftson: 数组， 记录 各 个 顶点 的 左 儿子 顶点 。 
rightson: 数组， 记录 各 个 顶点 的 右 儿 子 顶 点 。 
number: “记录 各 个 顶点 在 被 中 序 记 历时 的 次 序 序号 。 
测试 函数 ; 


void testInorder () 











A ACIC +H 代码 


// 
// 
// 
// 
// 


// 测试 结果 : 


// 
// 


中 序 遍历 结果 : 
324517689 


void inorderNonRecursive (int* leftson, int* rightson, 


{ 


) 


static int count -1; 
int vertex - root; 
stack < int >s; 


while (1) 
{ 
while (vertex! =EmptyPosition) 
{ 
s. push (vertex); 
vertex = leftson [vertex]; 
} 


if(! s. empty ()) 
( 
vertex =s. top(); 
s. pop(); 
number [vertex] =count; 
cout << vertex <<" V t"; 
count ++; 
vertex = rightson [vertex]; 
} 
else 
{ 
break; 


void testInorder () 


{ 


int number [10]; 
memset (number, 0, sizeof (int) * 10); 
int leftson[10]; 

int rightson[10]; 


//build the tree; 

leftson[0] =rightson[0] = EmptyPosition; 
leftson[1] -2; 

rightson[1]-6; 

leftson[2] =3; 

rightson[2] =4; 

leftson[3] = rightson[3] = EmptyPosition; 
leftson[4] = EmptyPosition; 

rightson[4] =5; 

leftson[5] 2» rightson[5] = EmptyPosition; 
leftson[6] 27; 

rightson[6] «8; 

leftson(7] = rightson[7} -EmptyPosition; 
leftson[8] = EmptyPosition; 

rightson[8] =9; 

leftson[9] =rightson(9] = EmptyPosition; 


//inorder with recursive. 


int* number, int root) 
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inorder (1, leftson, rightson, number, 10); 

cout << endl; 

memset (number, 0, sizeof (int)* 10); 

// inorder without recursive. 
inorderNonRecursive(leftson, rightson, number, 1); 
cout << endl; 


} 

int main () 

{ 
testInorder (); 
system("pause"); 
return 0; 

) 


A.4 查找 MAX 和 MIN 元 素 的 算法 


#include < iostream > 


using namespace std; 

// 参考 2.6 节 ， 查 找 一 个 数组 中 的 最 大 元 素 
// 输入 : 

// intarray: 输入 数组 

// sizeofArray: 输入 数组 的 元 素 个 数 


// 输出 : 

// 返回 找到 的 最 大 元 素 

// 测试 数据 : 

HM (1,3,5,4,2, 8, 9, 1}; 
// 测试 结果 : 


// 找到 最 大 元 素 为 9 
int findMax(int* intarray, int sizeofArray) 
( 
if(intarray = =NULL || sizeofArray = =0) 
{ 
return 0; 
} 
int max = intarray [0]; 
for(int i=0; i<sizeofArray; i ++) 
{ 
if (intarray [i] >max) 
{ 


max = intarray [iÍ]; 


} 
return max; 
} 
struct MaxMin 
{ 
int max; 
int min; 
MaxMin() 
{ 
max =0; 
min =0; 
} 
MaxMin (int_ max, int, min) 
{ 
Max =_ max; 
min =_ min; 
} 
}; 
/ / 找到 MAX 和 MIN 过程 
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// 找 出 一 个 集合 中 的 最 大 元 素 和 最 小 元 率 
// BA: 

// set: 用 数组 表示 的 集合 

// size: 集合 中 的 元 素 个 数 


// 输出 : 

// 返回 一 个 结构 体 的 指针 ， 结 构 体 中 包括 了 集合 的 最 小 元 素 和 最 大 元 素 
// 测试 函数 : 

f/f void test FindMaxMin () 

// WE: 

// (1,3, 5, 4, 2, 8, 9, 1}; 

// 测试 结果 : 

// (mx, min) = (9, 1); 


MaxMin* findMaxMin(int* set, int size) 
{ 
MaxMin * result =new MaxMin(); 
if (size = =2) 
{ 
result ->max =max(set [0], set[1]); 
result ->min=min(set [0], set[1]); 
} 
else 
{ 
int* subseti = set; 
int* subset2 =set +size/2;; 
MaxMin* subresultl = findMaxMin(subsetl, size/2); 
MaxMin* subresult2 = findMaxMin (subset2, size -size/2); 
result -»max -max(subresultl -»max, subresult2 -»max); 
result -»min -min(subresultl -»min, subresult2 -»min); 
) 
return result; 
) 
void testFindMaxMin() 


{ 
int al[8] = {1, 3, 5, 4, 2, 8, 9, 1}; 
cout << "max = " << findMax(a, 8) <<endl; 
MaxMin  * temp =findMaxMin(a, 8); 
cout << " (max, min) = ("«« temp -> max << ", " << temp -> min << ") " << endl; 
) 
int main() 
{ 
testFindMaxMin(); 
system("pause"); 
return 0; 
} 


A.5 .归并 排序 算法 


#include < iostream > 


using namespace std; 

// 归 并 两 个 排序 的 数组 

// 输 入 : 

/| a: 数组 ,已 升序 排序 

// ”sizeofa: 数组 a 的 元 素 个 数 

// w: 数组 ， 已 升序 排序 

// sizeofb: 数组 b 的 元 素 个 数 

// 输 出 : 

// ”返回 归并 后 的 数组 ， 归 并 后 的 数组 仍然 保持 升序 排序 
int* merge (int* a, int sizeofa, int* b, int sizeofb) 
{ 


int* mergeresult =new int [sizeofa + sizeofb]; 
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int k=0; 
int i=0; 
int j =0; 
for(; i«sizeofa && j<sizeofb; k++) 
{ 
if(a[i]« sb[j]) 


( 
mergeresult[k] -a[il; 
ie: 
} 
else 
{ 
mergeresult[k] -b[j]; 
j++; 
) 
} 
if (i<sizeofa) 
{ 
for(; i<sizeofa; i++) 
{ 
mergeresult[k] =a(il; 
ke: 
) 
) 
if (j <sizeofb) 
{ 
for(; j«sizeofb; j ++) 
{ 
mergeresult[k] =b[j]; 
k++; 
} 
} 
if (a! =NULL) 
{ 
delete[ja; 
} 
if(b! =NULL) 
{ 
delete([]b; 
) 
return mergeresult; 
H 
/ /归并 排序 的 算法 实现 : 
// 输 入 : 


// xi 待 排序 的 数组 
// i: 排序 范围 的 开始 位 置 
// j: 排序 范围 的 结束 位 置 
// 输 出 : 
// ”返回 排序 后 的 数组 (升序 排序 》 
/ /测试 函数 ; 
/f void testMergeSort () 
// 测 试 数据 ; 
// {2, 34, 5, 3, 65, 7, 88, 2, 8, 36, 92}; 
/ /测试 结果 : 
/f {2, 2, 3, 5, 7, 8, 34, 36, 65, 88, 92}; 
int* mergesort (int* x, int i, int j) 
{ 
if(i= =j) 
{ 


int* result =new int [1]; 
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result(0] -x[i]; 
return result; 
} 
else 
{ 
intmzi-«j-1; 
m/ =2; 
return merge (mergesort (x, i, m), m-i+1,  mergesort(x, m«1, j), j-m); 


) 
) 
void testMergeSort () 
( 
inta[]- (2, 34, 5, 3, 65, 7, 88, 2, 8, 36, 92); 
int* result -mergesort (a, 0, 10); 
for(int i=0; i«11; i++) 
{ 
cout << result [i] <<" Vt"; 
} 
cout << endl; 
if(result! -NULL) 
{ 
delete[] result; 
} 
} 
int main () 
{ 
testMergeSort (); 
system ("pause"); 
return 0; 
} 


A.6 对 矩阵 乘法 排序 的 动态 规划 算法 


#include < iostream > 


using namespace std; 

// V WNOBEERDRISU TET H 

// BA; 

// m: ”二 维 数组 (n+1) x (n+1)， 初 始 化 为 全 0; 

// r: 数组， 空间 大 小 为 n+1， 和 矩阵 M, 的 维 数 维 r[i-1] erli]; 
// ni: HA n^ BEES 


// 输出 : 

LA m: m(0]( *] 与 m[ *][0] 空 出 不 用 ， 
// 计算 后 m iJ LRSM, x …… x M, 的 最 小 运算 开销 
// 测试 函数 : 

// void testCalMinCost() 

// 测试 数据 : 

// r-(10, 20, 50, 1, 100); 

// 和 矩阵 1: 10* 20 

// JERE 2: 20* 50 

// 5BBE3: 50* 1 

// 和 矩阵 4: 1* 100 

// 测试 结果 : 

// ER m: 

// 0 10000 1200 2200 
// 0 0 1000 3000 

// 0 0 0 5000 

// 0 0 0 0 

void calMinCost(int* * m, int* r, int n) 
{ 


for (inti =1; i< =n; i++) 
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m[i] [i] =0; 
} 
for(int l=1; 1< =n-1; ie) 
{ 
for(int i=1; i< =n-1; i++) 
{ 
int j=i+l1; 
m(i](j] =m(i] fi] +m{i +1] (j] +rfi-1)* r(i]* r(3); 
for(int k=i; k<j; k++) 


{ 
if (m[i] [j] »m[i](k] em[k +1] [j] «r[i-1] * r[k] * r[31) 
{ 
m[i] [j] =m[i] [k] +m[k +1} {j] «r[i-1] * r[k] * r(jl; 
} 
} 
} 
} 
) 
void testCalMinCost () 
{ 
int r([) - (10, 20, 50, 1, 100}; 
int * * m=new int * [5]; 
for(int i=0; i«5; i++) 
{ 
m[i] =new int [5]; 
memset (m[i], 0, sizeof(int) * 5); 
} 
calMinCost (m, r, 4); 
for(int i=1; i<5; i++) 
{ 
for(int j=1; j<5; j++) 
{ 
cout <<m[i] [j] << \t’; 
} 
cout << endl; 
} 
} 
int main () 
{ 
testCalMinCost (); 
System("pause"); 
return 0; 
) 


A7 定 长 串 的 字典 排序 算法 


#include < iostream > 
#include < queue > 


using namespace std; 


// Fig 3.1 Lexicographic sort algorithm 

typedef int * pInt; 

// k is the number of components in one tuple, n is the number of the tuples, 
//0 tom-1 is the range of the components. 

typedef queue < pInt > Bucket; 

// 定 长 的 字典 序 排序 

// 输入 : 

// hi 待 排序 的 整数 序列 的 数组 。 每 个 元 素 是 一 个 整数 序列 ， 按 照 这 些 整数 的 字典 序 排序 
// n: 整数 序列 的 个 数 

// k: 整数 序列 的 长 度 
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// m; ”整数 序列 中 的 每 个 整数 范围 从 0 到 m -1。 


// 输出 ; 

// 计算 后 的 A 是 已 经 排序 好 的 整数 序列 。 

// 测试 函数 : 

// void testLexicographicSort (); 

// 测试 数据 ; 

// {1,2,3,5, 6}; 

// {2,3, 6,9, 2}; 

/i {1, 3,5,4,3}; 

// {2,3, 4,5, 6}; 

// {1,3, 4, 8, 4}; 

// 测试 结果 : 

// 排序 后 的 结果 : 

// {1 2 3 5 6} 
// {1 3 4 8 4} 
// {1 3 5 4 3} 
// {2 3 4 5 6} 
// (2 3 6 9 2) 


void LexicographicSort (pInt * A, int n, int k, int m) 
( 
Bucket * buckets - new Bucket [m] ; 
queue < pInt >q; 
for(int i=0; i<n; i++) 
{ 
q push (A[i]); 


} 
for(int j =k-1; j> =0; j--) 
{ 
while(! q empty ()) 
( 
pint a =q front (); 
qa pop (); 
buckets [a[j]]. push (a) ; 
) 


for(int 1=0; l«m; le) 
( 
while(! buckets[1]. empty ()) 
{ 
q push (buckets [1]. front ()); 
buckets[1]. pop(); 


} 
} 
if (buckets ! =NULL) 
{ 
delete []buckets; 
} 
// showing the result: 
while(! q empty ()) 
{ 
for(int 1=0; i<k; i++) 
{ 
cout <<q front () [i] «« ^Nt^; 
} 
cout << endl; 
q pop(); 
} 
} 
void testLexicographicSort () 
{ 
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pInt * a=new pInt (5]; 
int al[] ={1, 2,3,5, 6}; 


a[0] =al; 
int a2[12 (2, 3, 6,9, 2}; 
a[i]za2; 
inta3[]-2(1,3,5,4,3); 
a[2] =a3; 
int a4{[] ={2, 3,4,5, 6}; 
a[3] =a4; 
int a5[} ={1, 3, 4, 8, 4}; 
a[4] =a5; 


LexicographicSort (a, 5, 5, 10); 
) 
int main() 
( 
testLexicographicSort (); 
system ("pause"); 
return 0; 


} 


A.8 不 同 长 度 的 串 的 字典 排序 算法 


#include < iostream> 

#include <queue > 

#include <vector > 

using namespace std; 

// Fig 3.2 Lexicographic sort of strings of varing length 
typedef string * pString; 

typedef queue < pString > StrBucket; 

// 变 长 的 字符 串 的 字典 序 排序 

// 输入 : 

HH strings: ”由 字符 申 组 成 的 数组 ， 待 排序 

// strCnt: strings 中 的 字符 串 的 个 数 

// m: 每 个 字符 的 范围 在 0 ~m 之 间 

// 输出 : 

// 计算 之 后 得 到 的 strings 就 是 排序 后 的 字符 捉 数 组 

// RRR: 

// void testVaryLenLexicographicSort (); 

// 测试 数据 ， 

// "abc", "kdjkelg", "abdkdj", "dkehgke", "hello", "heloo", *dkekk"; 
// 测试 结果 : 

//” ”字典 序 排序 后 的 结果 : 

dd "abc", "abdkdj", "dkehgke", "dkekk*, "hello", "heloo", "kdjkelg"; 
void VaryLenLexicographicSort (string * strings, int strCnt, int m -256) 
( 

unsigned int maxlength -0; 
for(int i=0; i«strCnt; i ++) 


{ 
if (maxlength < strings [i]. length()) 
{ 
maxlength = strings [i]. length(); 
} 
} 


vector <pString>* length =new vector «pString > [maxlength +1]; 
vector <char >* nonempty = new vector «char > [maxlength]; 
for(int i=0; i«strCnt; i++) 
{ 
(length{strings [i]. length()]). push_ back (&(strings[i])); 
for(int j =0; j<strings{i]. length(); j++) 
{ 





章法 的 CAC HKG 





nonempty [j]. push, , back (strings[il.at(j)):; 


) 
queue «pString >q; 
StrBucket * buckets =new StrBucket [m]; 


for(int 1 =maxlength-1; 1» -0; 1--) 
{ 
for(int x=0; x<length{1+1]. size(}; x ++) 
{ 
q push (length[1 +1]. at (x)); 
} 
while(! q. empty ()) 
( 
pString ps =q. front(); 
buckets [ps ->at (1)]. push (ps) ; 
q pop (); 
} 
sort (nonempty [1]. begin(), nonempty [1]. end()); 
for(int j =0; j «nonempty [1]. size(); j ++) 
{ 
int val =nonempty[1). at (j); 
while(! buckets [val]. empty () ) 
{ 
pString ps = buckets [val]. front (); 
q push (ps); 
buckets [val]. pop() ; 


) 
while(! q empty () ) 
{ 
cout <<* (q front ()) << endl; 
a pop; 
} 
if (length ! - NULL) 
{ 
delete [] length; 
} 
if (nonempty ! =NULL) 
{ 
delete [] nonempty; 
} 
if (buckets ! =NULL) 
{ 
delete [] buckets; 


} 
void testVaryLenLexicographicSort () 
{ 
string * strings =new string[7]; 
strings [0] = "abc"; 
strings[1] = "kdjkelg"; 
strings [2] = "abdkdj"; 
strings [3] = "dkehgke"; 
strings (4] = "hello"; 
strings [5] = "heloo"; 
strings [6] = 'dkekk"; 
VaryLenLexicographicSort (strings, 7); 
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int main() 

( 
testVaryLenLexicographicSort (); 
system ("pause"); 
return 0; 

} 


A 9 快速 排序 程序 


#include < iostream > 
using namespace std; 


// Fig 3.8 Partitioning S into S1 and S2 union $3, in place. 

// 划分 数组 ， 以 [0] 为 界 ， 小 于 [0] 的 置 于 数组 左 段 ， 大 于 等 于 [0] HEKETEA 
// 输入 : 

// s: 待 划分 的 数组 

// Sf: ”划分 范围 的 开始 下 标 

A 4 划分 范围 的 结束 下 标 

// 输出 : 

// ni: 小 于 s [0] 的 元 素 个 数 

// s: 划分 好 的 数组 


void partitionArray (int * s, int f, int 1, int & n1) 


( 
nl =0; 
int pivot =f; 
int i =f +1; 
int j=1; 
while(i< =j) 
{ 
while(j > =f &&s[j] > -s(pivot]) 
{ 
j--: 
) 
while(i« =1 && s[i] <s{pivot]) 
{ 
i++; 
} 
if(j»-f&&i«-l&&ic«j) 
{ 
// 交换 sli] Hist] 
intt-s[íi]; 
s[i] =s[j}; 
s[j] =t; 
i++; 
j --; 
} 
} 
if(j> =f) 
{ 
// 交换 stpivot] 和 s[j] 
int t =s[pivot]; 
S[pivot] =s[j]; 
s[j] =t; 
nl-j-f; 
} 
else 
{ 
nl =0; 
} 
} 


// Fig. 3.7 Quick sort program 


FACC HRE 293 


// 快 速 排序 算法 的 递归 部 分 

// 输 入 : 

// os: 待 排序 的 数组 

// £: 递归 覆盖 范围 的 开始 下 标 
// 1l: 递归 覆盖 范围 的 结束 下 标 
// 输 出 : 

// | s: 递归 快速 排序 


void quickSortDriver(int * s, int f, int 1) 


( 
if(f»-1) 
( 
return; 
} 
else 
{ 
int nl =0; 
partitionArray (s, f, 1, n1); 
quickSortDriver(s, f, f «n1-1); 
quickSortDriver(s, f «nl +1, 1); 
) 
) 
// 快速 排序 算法 实现 
// 输入 : 


// s: ” 待 排序 的 数组 
// n: ”数组 的 大 小 
// 输出 : 
// s: ”排序 的 数组 
// 测试 函数 : 
// void testQuickSort (); 
// 测试 数据 : 
// {23, 2, 5, 63, 8, 2, 37, 9, 12, 34, 3}; 
// 测试 结果 : 
// (2,2,3,5,8,9, 12, 23, 34, 37, 63) 
void quickSort (int * s, int n) 
{ 
quickSortDriver(s, 0, n-1); 
} 
void testQuickSort () 
{ 
int af] ={23, 2,5, 63, 8, 2, 37, 9, 12, 34, 3}; 
quickSort (a, 11); 
for(int i =0; i«11; i++) 
{ 
cout <<a[i] «<< /^NV t^; 
} 
cout << endl; 
} 
int main() 
{ 
testQuickSort (); 
system("pause") ; 
return 0; 


} 


A10 选择 第 K 小 元 素 的 算法 
#include < iostream > 
#include «math h> 
using namespace std; 


// Fig 3.8 Partitioning S into S1 and S2 union S3, in place. 
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// 划分 数组 ， 以 s [0] 为 界 ， 小 于 s[0] 的 置 于 数组 左 豚 ， 大 于 等 于 s[0] 的 元 素 置 于 数组 右 段 
// A: 

// s; 待 划分 的 数组 

/1/ f: 划分 范围 的 开始 下 标 

// 1: 划分 范围 的 结束 下 标 


// nl: 小 于 sft0] 的 元 素 个 数 
// s: 划分 好 的 数组 
void partitionArray (int * s, int f, int l, int & n1) 
{ 
nl =0; 
int pivot =f; 
int i=f +1; 
int j=1; 
while(i« =j) 
{ 
while(j» =f && s[j] > =s(pivot]) 
{ 
j--; 
) 
while(i« -1&&s[i]«s[pivot]) 
t 
i++; 
} 
if(j>=f&ki<=l&&i<j) 
{ 
// 交换 s[i} M s[j] 
intt-s[i]; 
s(i]sstj): i 
s[j] =t; 
i++; 
j--; 
) | 
} 
if(j> =f) 
( | 
// 交换 s[pivot] Ris] | 
intt-s[pivot]; 1 
s(pivot] -s[j]: 
s[j] =t; 
nl-j-f; 





} | 

else 

{ 

nl =0; , 

| 
) q 
// Fig. 3.7 Quick sort program « 
// 快 速 排序 算法 的 递归 部 分 
// 输 入 : | 
// os: 待 排序 的 数组 
// f: 递归 覆盖 范围 的 开始 下 标 
// 1: 递归 覆盖 范围 的 结束 下 标 
// 输 出 : 
// s: 递归 快速 排序 
void quickSortDriver(int * s, int f, int 1) 
{ 
if(f>=1) 
{ 


return; 
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} 
else 
{ 
int nl =0; 
partitionArray (s, f, l, n1); 
quickSortDriver (s, f, f «nl -1); 
quickSortDriver (s, f£ «nl +1, 1); 
) 
) 
// 快速 排序 算法 实现 。 
// 输入 : 
// s: ” 待 排序 的 数组 
// n: ”数组 的 大 小 


// 输出 : 

// s: ”排序 的 数组 

// WARK: 

// void testQuickSort (); 

// 测试 数据 : 

// {23, 2, 5, 63, 8, 2, 37, 9, 12, 34, 3}; 
// 测试 结果 : 

// (2,2,3,5,8,9, 12,23, 34, 37, 63) 


void quickSort (int * s, int n) 
{ 
quickSortDriver(s, 0, n-1); 
} 
// fig 3.10 Algorithm to select kth smallest elememnt. 
// 从 数组 s PRB k ATOR 
// BIA: 
// k: ”指定 需 从 数组 中 找 出 第 kk 大 的 元 素 
// s: ”容纳 所 有 元 案 的 数组 
// n: ”数组 中 元 来 的 个 数 
// 输出: 
/1/ 返回 找到 的 数组 中 第 大 个 元 素 
// ”测试 函数 ; 
// void testSelect (); 
// 测试 数据 : 
// {23, 2,5,63,8,2,37,9,12,34, 3); 
// 测试 结果 : 
// k =10 从 小 到 大 排序 位 置 为 10 的 数字 是 : 37 


int select (int k, int * s, int n) 


( 


if(k»n) 

{ 
cout << "k 不 在 正确 选择 范围 内 " << endl; 
return -1; 

} 

if(n«50) 

{ 
quickSort (s, n); 
return s[k -1]; 

} 

else 

{ 


int count =n / 5; 


// 分 组 处 理 ， 每 组 最 多 5 个 元 素 。 
for(int i =0; i«count; i ++) 
{ 

quickSort(s+i* 5,5); 
} 
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int * M=new int [count]; 
int j =2; 
for(int i=0; i<count; i++) 
{ 
M[i] =s[j]; 
j+ =5; 
} 
int m= select (static. cast «int > (ceil(count/2. 0)) , M, count); 
int x=0; 
int y=n-1; 
int * ss -new int [n]; 
` for(inti =0; i<n; i++) 
{ 
if(s[i] <m) 
{ 
ss[x} =s[i}; 
X++; 
} 
else 
{ 
ss[y] »s[i]: 
Y--? 
} 
} 
int nl =x; 
if(ni» =k) 
{ 
return select (k, ss, n1); 
} 
else 
{ 
return select (k-nl, ss+ni, n-nl); 
} 
if(ss ! =NULL) 
( 
delete [] ss; 
) 
} 
} 
// Fig 3.12 Selection algorithm 
// 从 数组 s PRR RMR 
// WA; 
// k: 指定 需 从 数组 中 找 出 第 上 大 的 元 素 
// s: 容纳 所 有 元 素 的 数组 
// n: 数组 中 元 素 的 个 数 
// 输出 : 
// 返回 找到 的 数组 中 第 上 ATION. 
// ”测试 函数 ， 
// void testSelect(); 
// 测试 数据 ， 
/7 (23,2,5,63,8,2,37,9, 12, 34, 3); 
// 测试 结果 : 
// k =10 从 小 到 大 排序 位 置 为 10 的 数字 是 : 37 
int selectRandom(int k, int * s, int n) 
{ 
if (k>n) 
{ 
cout << "k 不 在 正确 选择 范围 内 " << endl; 


return -1; 
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if(n= =1) 
{ 
return s[0]; 
} 
else 
{ 
int nl =0; 
partitionArray(s, 0,n-1, nl); 
if(nl» -k) 
( 
return select (k, s, n1); 
) 
eise 
( 
return select {k -n1, s «n1, n-n1); 


) 
void testSelect() 
( 
int a[] ={23, 2, 5, 63,8, 2, 37,9, 12, 34, 3}; 
int k=10; 
cout << select (k, a, 11) <<endl; 
cout << selectRandom(k, a, 11) <<endl; 
} 
int main() 
{ 
testSelect(); 
system ("pause"); 
return 0; 


) 


A. 11 最 小 代价 生成 树 算法 


#include < iostream > 
#include «list > 
#include < vector > 
#include <algorithm> 
#include < stack > 
#include «stdlib h> 
using namespace std; 
struct Edge 
{ 
int start; 
int end; 
float weight; 
Edge(int _ start, int _ end, float _ weight) 
{ 
start =_ start; 
end =_ end; 
weight =_ weight; 
} 
bool operator < (const Edge & e) const 
{ 
return this ->weight <e weight; 
} 
bool operator > (const Edge & e) const 
{ 
return this -» weight » e. weight; 
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bool operator > = (const Edge & e) const 


{ 
retun this ->weight > =e. weight; 
} 
bool operator < = (const Edge & e) const 
{ 


return this -> weight < =e. weight; 
} 
bool operator = = (const Edge & e) const 
{ 
return (this ->weight == e weight && 
this ->start --e. start && 
this ->end= =e. end); 


}; 
int find(int v, int * name, int * father); 
void unionSet(int * father, int * name, int * count, int * root, 
int i, int j, int k, int setnamerange); 
// Fig. 5.2 
// 最 小 生成 树 的 生成 
// 输入 : 
// vi ” 原 图 的 点 集 ( 点 从 1 到 nv -1) 
// nv: 原 图 的 点 的 数目 
" E; 原 图 的 边 集 
// 输出 : 
// 生成 的 最 小 生成 树 边 集 为 T， 点 集 仍然 为 V 
// 测试 函数 ; 
// testBuildMinimunCost SpanningTree () 
// 测试 数据 : 
// 原 图 由 4 点 组 成 : 0, 1, 2,3, 4, 5, 6 
// 20 
// vw0------- vi 
// /\ /\ 
// 23/ M1 4/ N15 
// /36 \ /9 \ 
/7 vb------- v6----+---- v2 
// \ / \ / 
// 28 \ /25 N16 /3 
// \/ 17 \/ 
// v4 -------- v3 
// 测试 结果 : 
// 生成 树 点 集 与 原 图 一 致 ; 0, 1, 2, 3, 4, 5, 6 
// v0 vi 
// /下 / 
f/f 23/ \l 4/ 
/4/ / N / 9 
// v5 v6---+--- v2 
// / 
// /3 
// 17 / 
// vVA-------- v3 
void buildMinimunCostSpanningTree (int * V, int nV, vector «Edge » & E, vector < Edge » & T) 
{ 
T. clear (); 
// 初始 化 一 个 集合 的 集合 
int * father =new int [nV]; 
int * root -new int [nV]; 
int * count -new int [nV]; 
int * name = new int [nV]; 
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) 


// 每 个 点 都 初始 化 为 一 个 单独 的 点 集 
for(int i=0; i«nV; i++) 
{ 
father[i] = -1; 
count [i] -1; // 每 个 集合 i 中 都 只 有 i 这 一 个 元 素 
root [i] =i; // 集合 i 的 根 顶 点 就 是 点 i; 
name [i] =i; 
} 
// 用 堆 的 形式 来 存放 图 中 所 有 的 边 E; 
make, heap (E. begin(), E end(), greater < Edge > ()); 
vector «Edge >:: iterator edgeEndIt - E end(); 
while(true) 
( 
if (count [root [find(0, name, father)]] > -nV || edgeEndIt = = E begin()) 
{ // 所 有 的 点 都 在 同一 个 点 集中 了 ， 表 示 了 中 已 经 覆盖 了 所 有 的 点 


break; 


) 

// 从 E 中选 出 权重 最 小 的 一 条 边 v, w); 

Edge e =E at (0); 

// 从 三 中 删除 (v，w) ; 

pop_ heap (E begin(), edgeEndIt, greater < Edge > ()); 

edgeEndIt - -; 

int Wl = find (e. start, name, father); 

int W2 = find (e. end, name, father); 

if(Wi ! =W2) //v Aw 在 Vs PRAB AM w Awe 中 

{ 
// 用 点 集 员 union w2 代替 VS PRIS wi Al we; 
unionSet (father, name, count, root, Wl, W2, W2, nV); 
// 将 边 (v, w) MAB T; 
T. push_ back (e); 


} 


void testBuildMinimunCostSpanningTree () 


{ 


int V[] ={0,1, 2, 3, 4, 5, 6}; 
vector < Edge >E; 
Edge e01(0, 1, 20); 


Edge e12 (1, 2, 15); 
Edge e23 (2, 3, 3); 
Edge e34(3, 4, 17); 
Edge e45 (4, 5, 28); 
Edge e50 (5, 0, 23); 
Edge e06 (0, 6, 1); 
Edge e16(1, 6, 4); 
Edge e26 (2, 6, 9); 
Edge e36 (3, 6, 16); 


Edge e46 (4, 6, 25); 
Edge e56 (5, 6, 36); 
E. push, , back (e01) ; 
E push_ back (e12); 
E. push_ back (e23); 
E. push_ back (e34) ; 
E. push_ back (e45); 
E. push, back (e50) ; 
E. push_ back (e06); 
E. push_ back (e16); 
E. push_ back (e26); 
E. push_ back (e36); 
E. push_ back (e46); 
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E. push, back (e56); 
vector « Edge » tree; 
tree. clear(); 
buildMinimunCostSpanningTree (V, 7, E, tree); 
cout << "In the min cost spanning tree built: " << endl; 
for (vector «Edge > :: iterator it -tree. begin(); it ! -tree end(); it ++) 
{ 
cout ««"(" «cit ->start << "," «cit -> end <<"): " «« it -» weight << end1; 
} 
} 
int main () 
{ 
testBuildMinimunCostSpanningTree(); 
System("pause"); 
return 0; 
} 
// Fig 4.18 Executing instruction FIND (i) 
// 在 集合 中 查找 某 个 元 素 所 在 的 集合 名 (集合 用 树 的 结构 来 表示 ) 
// 输入 : 
/1/ {v : 查找 顶点 v 
// name: 数组 ， 存 放 每 个 根 顶 点 对 应 的 集合 的 名 称 。name [v] 表 示 根 顶点 为 v 的 集合 的 名 称 
// father: 数组 ， 存 放 每 个 顶点 的 父 顶 点 ， 如 father [v] 表 示 顶 点 v 的 父 顶点 
// 输出 : 
// vi 所 属于 的 集合 名 将 打印 到 控制 台 (console) 上 ， 并 返回 vi 所 属于 的 集合 名 
// 测试 数据 : 给 定 集合 : 


// ERv =3; 
// 测试 结果 :” 找 出 根 顶 点 7， 打 印 出 集合 名 3 ， 并 将 集合 调整 为 一 下 结构 
了 


// £N NN 
// 5 213 
int find(int v, int * name, int * father) 
{ 
list <int >1; 
l. clear (); 
// 从 节点 v 向 上 追 滴 ， 知 道 这 个 集合 的 根 顶 点 
while(father[v] ! = -1) 
( 
l. push, back (v); 
v =father[v); 
} 
// Vv 此 刻 已 经 是 根 顶 点 


BRA 


// 调整 向 上 追溯 的 路 径 上 的 所 有 的 顶点， 调整 它们 使 得 它们 全 部 都 直接 连 在 根 上 ， 减 少 之 后 搜索 的 代价 


for (list <int >:: iterator it =1. begin(); it ! -1.end(); it ++) 
( 
father[* it]-v; 

H 

return name[v]; 
) 
// fig 4. 19 Executing instruction UNION(i, j, k) 
// 集合 求 并 算法 实现 (集合 用 树 结构 来 表示 ) 
// 输入 : 
// father: 数组， 存放 每 个 节点 的 父 顶点 ， 如 father [v] 表 示 顶 点 v 的 父 顶点 
// name; 数组 ， 存 放 每 个 根 顶 点 对 应 的 集合 的 名 称 。name [v] 表 示 根 顶点 为 v 的 集合 的 名 称 
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// 
// 
// 
// 
// 
// 
// 
// 
// 
RA 
// 
// 
// 
// 
// 
Vf 
// 
// 
// 
// 
// 
RA 


count; 数组 ， 存 放 每 个 根 顶 点 代表 的 集合 中 的 元 素 的 个 数 
count [v] 表 示 根 顶点 是 v 的 集合 的 元 素 的 个 数 
root: 数组 ， 存 放 每 个 集合 对 应 的 根 顶点 。root lil ARRA i 的 根 顶 点 v 
i, j: 给 外 部 名 称 为 i 和 j 的 集合 求 并 
k 求 并 后 的 集合 外 部 名 称 
setnamerange: 集合 名 的 范围 ， 只 能 从 0 到 (setnamerange -1) 
输出 ， 
运行 结束 后 的 数组 中 存放 的 就 是 求 并 之 后 的 结果 
测试 数据 : 
求 并 之 前 的 集合 如 下 : 
集合 1:4 集合 2: 7 集合 3: 10 
LN N / 
2 5 6 11 
/N ALN 
3 9 1 8 
将 集合 2 和 集合 3 求 并 ， 求 并 后 的 新 集合 为 4 
测试 结果 : 
集合 1 RE, 集合 4 7 


1 8 11 


void unionSet (int * father, int * name, int * count, int * root, int i, int j, int k, int setna- 
merange) 


( 


if (i > -setnamerange || j > = setnamerange || k > -setnamerange || 
i«0 | 3j«0O || k<0) 

{ 
cout << "the set name is out of the range. " << endl; 


cout << “please use the set name among 0 to * << setnamerange - 1 << endl; 
return; 


} 

if (root [i] = = -1 && root{j] = = -1) 

{ 
cout << "error: the set i and j are both empty! " << endl; 
return; 

) 

int counti -root[i] = = -1 ? 0: count [root []]; 

int countj »root[j] = = -1? 0: count (root [31]; 

if (counti > countj) 


( 


intt-i; 
i=j; 
j=t; 
} 
int large = root {j]; 
int small = root [i]; 
if (small ! = -1) // 小 的 集合 不 是 空 集 
{ 
father [small] = large; 
name [small] = -1; 
count [small] =0; 
) 
count [large] = count [large] + count [small]; 
name [large] =k; 
root [i] = -1; 
root [j] = -1; 
root [k] = large; 
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二 分 搜索 算法 


#include < iostream > 
using namespace std; 
// Fig 4.3 Binary search algorithm 


// 二 分 搜索 算法 
// WA: 
// a: 待 搜索 的 元 素 
// A; 供 搜索 的 数组 ， 数组 中 的 元 素 是 升序 排序 的 
// f: 数组 搜索 范围 的 开始 下 标 
11 li 数组 搜索 范围 的 结束 下 标 
// 输出 : 
// 返回 bool 变量 ， 找 到 返回 true， 未 找到 返回 false 
// WARK: 
// void testbinarySearch(); 
// 测试 数据 ; 
// (1,3,6, 7, 43, 45, 98, 345, 455, 599} 
// 测试 结果 : 
// 在 数据 中 搜索 ，455 返回 true 
/1 在 数据 中 搜索 ，47 返回 false 
bool search(int a, int * A, int f, int 1) 
{ 
if(f>1) 
{ 
return false; 
} 
else 
{ 
if la= =A[(£+1)/2)) 
{ 
return true; 
) 
else if(a<A{(f+1) / 2]) 
{ 
return search(a, A, f, (£+1)/2-1); 
) 
else 
{ 
return search(a, A, (f +1)/2 +1, 1); 
} 
} 
} 


void testbinarySearch () 


{ 


int a[]-(1,3, 6,7, 43, 45, 98, 345, 455, 599); 
int searchfor 2455; 
if (search(searchfor, a, 0, 9)) 
{ 
cout << "找到 ，<< searchfor << endl; 
} 
else 
{ 
cout << searchfor << "不 在 待 搜索 数组 中 !" << endl: 
) 
searchfor =47 
if(search(searchfor, a, 0, 9)) 
( 
cout << "找到 ，<< searchfor << endl; 
} 


else 
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{ 
cout << searchfor << "不 在 待 搜索 数组 中 !" << endl; 
) 
) 
int main() 
{ 
testbinarySearch(); 
system ("pause"); 
return 0; 
} 


A. 13 在 二 叉 查 找 树 中 搜索 特定 元 素 


#include < iostream > 
using namespace std; 
// Fig 4.5 Searching a binary search tree. 
// 二 叉 查 找 树 顶点 定义 
struct BSTNode 
{ 
int value; // 节点 的 值 
BSTNode * left; // 节点 的 左 子 顶 点 
BSTNode * right; // 节点 的 右 子 顶点 
BSTNode (int _ value) 
{ 
value =_ value; 


left =NULL; 
right = NULL; 
} 
BSTNode (} 


( 
) 
}; 
// 在 二 叉 查 找 树 中 搜索 特定 元 察 
// 输 入 : 
// a: 待 搜索 的 值 
// vi 开始 搜索 的 根 顶 点 


// 输 出 : 

// 返回 bool 值 ， 如 果 在 树 中 找到 待 搜索 的 值 ， 返 回 true, GM, KE false 
/ PRB: 

// void testBinarySearchTreeSearch(); 
// 测 试 数据 ; 

// 在 下 列 树 中 搜索 特定 元 素 

// 5 

// / N 

// 2 7 

// EY /NA 

// 1 3 6 10 

// 测 试 结果 : 


// 搜索 8 : 返回 false 
// 搜索 7 : 返回 true 
bool search(int a, BSTNode * v) 
{ 
if(as -v-»value) 
( 
return true; 
) 
eise if(a«v -» value) 
( 
if(v->left ! -NULL) 
( 
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return search(a, v -> left); 
} 
else 
{ 

return false; 


} 
else 
{ 
if(v->right ! =NULL) 
{ 
return search (a, v -> right); 
} 
else 
{ 


return false; 


} 
void testBinarySearchTreeSearch() 
{ 
BSTNode * root =new BSTNode (5); 
BSTNode * cur = root; 
cur -» left =new BSTNode (2); 
cur -» right = new BSTNode (7); 
cur =cur ->left; 
cur -> left =new BSTNode (1); 
cur -> right = new BSTNode (3) ; 
cur = root -» right; 
cur -» left - new BSTNode (6) ; 
cur -> left = new BSTNode (10) ; 
int searchfor -7; 
if (search(searchfor, root)) 
{ 
cout << searchfor << "YE —- X ÆRA p" << endl; 
) 
else 
{ 
cout <<" 树 中 未 找到 :。<< searchfor << endl; 


searchfor -8; 
if(search(searchfor, root)) 
{ 


cout << searchfor <<" 在 二 叉 查 找 树 中 " << endl; 
} 
else 
{ 


cout << " 树 中 未 找到 ; * << searchfor << endl; 


} 

int main() 

{ 
testBinarySearchTreeSearch () ; 
system ("pause"); 
return 0; 


} 


A. 14 计算 最 优 子 树 根 的 算法 


#include < iostream > 
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using namespace std; 
// 二 叉 查 找 树 顶 点 定义 
struct BSTNode 
{ 
int value; // 顶点 的 值 
BSTNode * left; // 顶点 的 左 子 顶点 


BSTNode * right; // 顶点 的 右 子 顶点 
BSTNode (int _ value) 


( 


value =_ value; 


left - NULL; 
right - NULL; 
) 
BSTNode () 


{ 
} 
3 
// Fig 4.9. Algorithm to compute roots of optimal subtrees. 
// 计算 最 优 子 树 的 根 的 算法 实现 
//p, q 的 数组 规模 是 n + 1; root 的 矩阵 规模 是 n x n 
// 输入 : 
H p: 数组 , p[i] 表示 查找 集合 中 第 i 个 元 素 的 概率 
// a: 数组 ,al0] 表 示 查 找 a <A[11 的 概率 , q[i] 表 示 查 找 Ali) <a<a[i+1l] 的 概率 
// q[n] 表 示 查 找 a >Afn] 的 概率 
// root; 初始 化 为 全 0 
/| n 集合 A 中 元 素 的 个 数 为 n -1， 表 示 时 占用 数组 的 1 - (n -1) 下 标 ， 下 标 0 保留 不 用 
// 输出 : 
// root: 计算 后 的 最 优 根 顶 点 。root [11 {j] 表示 子 树 afi +1]……a[j] 的 最 佳 根 顶 点 
// 测试 函数 ; 
// void testOptimalBinaryTree(); 
void calRootsOfOptimalBinaryTree (float * p, float * q, int * * root, int n) 
{ 
typedef float * pFloat; 


pFloat * weight = new pFloat [n]; 
pFloat * cost -new pFloat[n]; 
for(int i =0; i<n; i++) 
{ 
weight fi] =new float [n}; 
cost [i] =new float [n]; 
} 
for(int i=0; i<n; i++) 
{ 
for (int j =0; j<n; j++) 
{ 
weight [i] [j] =0; 
cost [i] [Jj] =0; 
} 


} 
for(int i=0; i<n; i++) 
{ 

weight [i] [i] =q[il; 
} 


for(int 1=1; len; l ++) 
{ 
for(int i=0; i<n-1; i++) 
{ 
int j=1 +i; 
weight [i] {j] =weight [i} [j -1] +p{jl * ati]; 
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int k=i +1; 
int m=k; 
float minVal = cost [i] [k-1] +cost [k] [j]; 
for(; k< =j; k++) 
{ 
if (cost [i] [k -1] +cost [k] [j] «minVal) 
{ 
minVal -cost[i][k-1] +cost [k] [3]: 
m=k; 
) 
) 
cost [i](j] =weight [i] [j] +cost [i] [m-1] «cost [m1 [j]; 
root [i][j] =m; 
} 
} 
} 


// a is the array of all elements in the set. 
// 根 据 计算 出 来 的 最 佳 根 顶 点 ， 建 立 最 优 子 树 
// 输 入 : 
// i: 表示 树 中 顶点 从 a[i +1] 开 始 
// j: 表示 树 中 顶点 范围 到 a [j] 结 束 
// a: 表示 和 集合， 包含 所 有 的 集合 元 察 。 其 中 的 元 素 满 足 a[li] <a[li +1] 
// n 表示 集合 元 束 下 标 从 1 到 mn -1， 数 组 的 规模 为 n 
// 输 出 : 
// ”返回 建立 子 树 的 根 顶 点 
BSTNode * buildTree(int i, int j, int * * root, int * a, int n) 
{ 
if(i>=n || j> =n) 
{ 
return NULL; 
} 
int m=root[i][j]; // this is the root of the tree. 
BSTNode * rootnode = new BSTNode () ; 
rootnode -> value -a[m]; 
rootnode -> right - NULL; 
rootnode -> left = NULL; 
if(i«m-1) 


{ 

rootnode -> left =buildTree(i, m-1, root, a, n); 
} 
if (j >m) 


{ 
rootnode -> right -buildTree(m, j, root, a, n); 
} 
return rootnode; 
} 
void inorderPrintTree (BSTNode * root) 
{ 
if (root = =NULL) 
{ 
return; 
} 
inorderPrintTree (root -> left); 
cout << root -> value << endl; 
inorderPrintTree (root -> right): 
} 
void testOptimalBinaryTree() 
{ 
// 初始 化 root 矩阵 


int * * root =new int * [5]; 
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for(int i =0; i <5; i++) 
{ 

root [i] =new int [5]; 

memset (root [i], 0, sizeof (int) * 5); 
) 
// 初始 化 p, a, a; 
inta []2(0, 5, 7, 9, 10); 
float p {] = (0, 0.25, 0.125, 0.0625, 0.0625}; 
float q [] = (0. 125, 0.1875, 0.0625, 0.0625, 0.0625); 
calRootsOfOptimalBinaryTree (p, q, root, 5); 
BSTNode * r-buildTree(0, 4, root, a, 5); 
for(int i =0; i<5; i++) 
{ 

for(int j=0; j«5: j++) 

{ 

cout << root [i] [j] «« ^ Nt ^; 

} 

cout << endl; 
) 


inorderPrintTree(r); 
int main() 


testOptimalBinaryTree(); 
System("pause"); 
return 0; 

} 


A.15 UNION 算法 


#include < iostream > 

using namespace std; 

// Fig 4.14 Implementation of UNION instruction 

// union the set i and the set j, set k is the destination set. 

// 集合 求 并 的 算法 实现 

// BA: 

/7 internal, name: internal name[i] 表示 外 部 名 为 i 的 集合 的 内 部 名 
// external, name: external name[i] 表示 内 部 名 为 i 的 集合 的 外 部 名 
// size: size[i] 表示 内 部 名 称 为 i 的 集合 的 元 素 个 数 

// list: list[i] 表示 内 部 名 称 为 i 的 集合 的 第 一 个 元 素 在 refer 中 的 下 标 
// refer: refer[i] 中 放 属 的 是 元 素 i 所 属于 的 集合 的 内 部 名 称 

// | next: next [i] 中 放置 的 是 元 素 i 的 下 一 个 元 素 在 refer 中 的 下 标 

// i,j: 给 外 部 名 称 为 i 和 j 的 集合 求 并 

// k: 求 并 后 的 集合 外 部 名 称 

// 输出 : 

// 以 上 的 各 个 数组 中 的 内 容 被 更 新 ， 表 示 了 最 新 求 并 之 后 的 集合 

// 测试 函数 : 

// void testUnionSet (); 

// 测试 数据 ; 

// 集合 1 = {0,3,5,7}; 

// 集合 2 = {2, 4, 8} 

// 4483-16); 


// 测试 结果 : 
// 将 集合 1，2 取 并 成 为 集合 4 后 
// 合 3: {6,} 


// 集合 4: {2, 4, 8, 0, 3, 5, 7,) 


void unionSet (int * internal | name, int * external, name, int * size, int * list, int * refer, 
int * next, 


int i, int j, int k) 





308 





) 


int a=internal_ name[i]; 
int b=internal_ name{j]; 
int last = -1; 

if (size[a] >size[b]) 


{ 
// exchange the role of a and b. 
int t =a; 
a=b; 
b=t; 


) 
int element = list [a]; 
while (element | = -1) 
{ 
refer [element] =b; 
last =element; 
element = next [element]; 
} 
next [last] = list [b]; 
list [b] = list [a]; 
size[b] =size[a] +size[lb]; 
internal | name[k] =b; 
external  name[b] =k; 


void showSets(int * refer, int * next, int * list, int * size, 
internal, name, int setname) 


( 


) 


int inter, name = internal, name [setname]; 
cout << "集合 " << setname <<": {"; 
for(int e = list [inter_ name]; e! = -1; e=next[e]) 
{ 
cout <<e<<","; 
} 


cout << ")" << endl; 


void testUnionSet () 


{ 


} 


int refer (] ={1, -1,2,1,2,1,0,1, 2}; 

int next [] ={3, -1,4,5,8,7, -1, -1, -1}; 

int list (] = (6, 0, 2); 

int size [] = (1, 4, 3); 

int external, name [] = (3, 1, 2}; 

int internal name (7) ={-1,1,2,0, -1, -1, -1}; 
// 以 上 数据 结构 ， 表 示 了 集合 1 = (0,3,5,7); 

// 集合 2 = {2, 4, 8} 

// 集合 3 = {6}; 


BRA 


int * external, name, int * 


showSets (refer, next, list, size, external, name, internal name, 1); 
showSets (refer, next, list, size, external | name, internal, name, 2); 
showSets (refer, next, list, size, external, name, internal, name, 3); 
unionSet (internal, name, external, name, size, list, refer, next, 1,2, 4); 


cout << "将 集合 1，2 取 并 成 为 集合 4 后 : " << endl; 


showSets (refer, next, list, size, external name, internal name, 3); 
showSets (refer, next, list, size, external name, internal, name, 4); 


int main() 


( 


testUnionSet (); 
system ("pause"); 
return 0; 
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A.16 FIND(i) 的 执行 


#include < iostream > 

#include < list > 

using namespace std; 

// Fig 4.18 Executing instruction FIND (i) 

// 在 集合 中 查找 某 个 元 素 所 在 的 集合 名 (集合 用 树 的 结构 来 表示 ) 

// 输入 : 

// vo: 查找 顶点 v 

// name; 数组 ， 存 放 每 个 根 顶点 对 应 的 集合 的 名 称 。name [v] 表 示 根 顶点 为 v 的 集合 的 名 称 
// father: 数组 ， 存 放 每 个 顶点 的 父 顶点 ， 如 father [v] 表示 顶 点 v HHA 


// Vi 所 属于 的 集合 名 将 被 打印 到 控制 台 ( console) 上 ， 并 返回 vi 所 属于 的 集合 名 
// 测试 函数 : testPind() 
/7 测试 数据 BERA: (集合 名 为 3) 

了 


// 查找 v = 3; 
// MRAR: 找 出 根 顶点 7， 打 印 出 集合 名 3 ， 并 将 集合 调整 为 一 下 结构 
了 


// ANNAS 
// 5 213 
int find(int v, int * name, int * father) 
{ 
list <int >l; 


l. clear (); 
// 从 节点 v 向 上 追 潮 ， 知 道 这 个 集合 的 根 顶 点 
while (father[v] ! = -1) 


{ 
1. push_ back (v) ; 
v = father [v]; 
} 
// v 此 刻 已 经 是 根 顶 点 。 
// 调整 向 上 追 滴 的 路 径 上 的 所 有 的 顶点 ， 调 整 它们 使 得 它们 全 部 都 直接 连 在 根 上 ， 
/1 减少 之 后 搜索 的 代价 
for (list <int>:: iterator it =1.begin(); it ! -l.end(); it ++) 
t . 
father[* it] =v; 
} 
return name[v]; 
} 
void testFind() 
{ 
int name[]-(-1, -1, -1, -1, -1, -1, -1, 3}; 
int father[]-(-1,2,7, 1, -1,7, -1, +1}; 
int vertex =3; ‘ 
int set =find(vertex, name, father); 
cout << "节点 " << vertex <<" 属于 集合 :“<< set << endl; 
} 
int main () 
{ 
testFind(); 
system("pause"); 
return 0; 
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A. 17 UNION(i, j, k) 的 执行 


#include < iostream > 

#include < list > 

using namespace std; 

int find(int v, int * name, int * father); 

const int EMPTY_ POSITION = -1; 

// fig 4.19 Executing instruction UNION(i, j, k) 

// 集合 求 并 算法 实现 (集合 用 树 结构 来 表示 ) 

// 输入 ; 

// father: 数组 ， 存 放 每 个 顶点 的 父 顶点 ， 如 father fv] 表 示 顶 点 v 的 父 顶 点 
// name: 数组， 存放 每 个 根 顶 点 对 应 的 集合 的 名 称 

// name [v] 表示 根 顶点 为 v 的 集合 的 名 称 

// count; 数组 ， 存 放 每 个 根 顶 点 代表 的 集合 中 的 元 素 的 个 数 

// count [v] 表 示 根 顶点 是 v 的 集合 的 元 素 的 个 数 

// root: 数组， 存放 每 个 集合 对 应 的 根 顶 点 。root [i] 表示 集合 i 的 根 顶点 v 
// i, j: ”给 外 部 名 称 为 i 和 j 的 集合 求 并 

// k: 求 并 后 的 集合 外 部 名 称 


// setnamerange: 集合 名 的 范围 ， 只 能 从 0 到 (setnamerange -1) 
// 输出 : 

// 运行 结束 后 的 数组 中 存放 的 就 是 求 并 之 后 的 结果 
// 测试 函数 : 

// void testUnionTreeSet () 

// 测试 数据 : 

// 求 并 之 前 的 集合 如 下 : 

// ”集合 1: 4 集合 2: 7 48 3:10 
ff /\ \ / 
// 2 5 6 11 
// /\ AN 

// 3 9 1 8 

// ”将 集合 2 和 集合 3 求 并 ， 求 并 后 的 新 集合 为 4 

// 测试 结果 : 

// REL 不 变 ， 集 合 4 7 

ff [SN 

ff 6 10 

// AN N 

// 1 8 11 


void unionSet (int * father, int * name, int * count, int * root, 
int i, int j, int k, int setnamerange) 
( 
if (i > -setnamerange || j > -setnamerange|| k > =setnamerange || 
i<O || 3 <0 || k<0) 
{ 
cout << "the set name is out of the range. " << endl; 


cout << "please use the set name among 0 to " << setnamerange - 1 << endl; 
return; 


} 
if (root [i] = =EMPTY_ POSITION && root [j] = =EMPTY_ POSITION) 
{ 

cout << "error: the set i and j are both empty! " << endl; 


return; 
} 
int counti = (root [i] = =EMPTY_ POSITION ? 0: count [root [i]]); 
int countj = (root [j] = = EMPTY,, POSITION ? 0: count [root [j]]); 


// 为 了 保证 root [j] 是 大 集合 ,root [i] 是 大 集合 
if (counti »countj) 
( 

int t=i; 

i=j; 
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jst; 
} 
int large =root[j]; 
int small = root [i]; 
if(small ! =EMPTY_ POSITION) // 小 的 集合 不 是 空 集 。 
{ 
father[small] = large; 
name [small] = -1; 
count [large] =count [large] +count [small]; 
count [small] =0; 
) 
name [large] =k; 
root (i] = EMPTY_ POSITION; 
root [j} = EMPTY_ POSITION; 
root[k] = large; 
} 
void testUnionTreeSet () 
{ 
int root [] = (EMPTY_ POSITION, 4, 7, 10, EMPTY_ POSITION, EMPTY_ POSITION, EMPTY_ POSI- 
TION}; 
int name[] = (EMPTY POSITION, EMPTY, POSITION, EMPTY_ POSITION, EMPTY_ POSITION, 1, 
EMPTY_ POSITION, EMPTY_ POSITION, 2, EMPTY_ POSITION, EMPTY_ POSITION, 3}; 
int count[] ={0,0,0,0,5,0, 0, 4,0, 0, 2}; 
int father[] = {EMPTY_ POSITION, 6, 4, 2, EMPTY | POSITION, 4, 7, 
EMPTY_ POSITION, 6,2, EMPTY POSITION, 10}; 
unionSet (father, name, count, root, 2, 3, 4, 7); 
cout << "新 集合 4 HGR MA: 0 << count [root [4]] << endl; 
int setname = find(11, name, father); 
cout << "JUÉ 11 在 集合 " << setname << "H" << endl; 
setname = find (8, name, father); 
cout << "JU 8 在 集合 " << setname << "P" << endl; 
} 
int main() 
{ 
testUnionTreeSet (); 
system("pause"); 
return 0; 
} 
int find(int v, int * name, int * father) 
{ 


list <int >1; 


1. clear (); 
// 从 顶点 v 向 上 追 淹 ， 知 道 这 个 集合 的 根 顶 点 。 
while(father[v] ! = -1) 


{ 
1. push_ back (v) ; 
vz-father[v]; 
) 
//v 此 刻 已 经 是 根 顶 点 。 
// 调整 向 上 追 潮 的 路 径 上 的 所 有 的 顶点 ， 调 整 它们 使 得 它们 全 部 直接 连 在 根 上 ， 
// 减少 之 后 搜索 的 代价 。 
for(list <int>:: iterator it «l. begin(); it ! =1.end(); it ++) 
{ 
father [* it] =v; 
} 
return name[v]; 


} 


A18 求 最 小 元 素 的 离线 算法 


#include < iostream > 
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#include < list > 

using namespace std; 

int find(int v, int * name, int * father); 

const int EMPTY_ POSITION = -1; 

// fig 4.19 Executing instruction UNION(i, j, k) 

// 集合 求 并 算法 实现 (集合 用 树 结构 来 表示 ) 

// MA: 

/7 father: 数组 ， 存 放 每 个 顶点 的 父 顶点 ， 如 father fv] 表 示 荐 点 v 的 父 顶 点 
// name: 数组 ， 存 放 每 个 根 顶 点 对 应 的 集合 的 名 称 

HH name [v] 表 示 根 顶点 为 v 的 集合 的 名 称 

// count; 数组 ， 存 放 每 个 根 顶 点 代表 的 集合 中 的 元 素 的 个 数 

// count [v] 表 示 根 顶点 是 v 的 集合 的 元 素 的 个 数 

// root: 数组 ， 存 放 每 个 集合 对 应 的 根 顶 点 。root [i 1 表示 集合 i 的 根 顶 点 v 
// i, ji ”给 外 部 名 称 为 i 和 j 的 集合 求 并 

// k: 求 并 后 的 集合 外 部 名 称 


it setnamerange: 集合 名 的 范围 ， 只 能 从 0 到 (setnamerange -1) 
// 输出 : 

/1 运行 结束 后 的 数组 中 存放 的 就 是 求 并 之 后 的 结果 
// 测试 函数 : 

// void testUnionTreeSet () 

// 测试 数据 : 

// 求 并 之 前 的 集合 如 下 : 

// 94814 集合 2: 7 集合 3: 10 
// /N \ / 
// 2 5 6 11 
Hl /N FN 

// 3 9 1 8 

// ”将 集合 2 和 集合 3 求 并 ， 求 并 后 的 新 集合 为 4。 
// 测试 结果 : 

// RÈL RE, 集合 4 7 

i i \ 

// 6 10 

// /NA 

/1/ 1 8 11 


void unionSet(int * father, int * name, int * count, int * root, 
int i, int j, int k, int setnamerange) 
{ 
if (i > =setnamerange || j > = setnamerange || k> =setnamerange || 
i«0 || 3 <0 |] k<0) 
{ 
cout << "the set name is out of the range. * «« endl; 
cout << "please use the set name among 0 to * << setnamerange -1 << endl; 
return; 
} 
if (root [i] = = EMPTY_ POSITION && root [jl = =EMPTY_ POSITION) 
{ 
cout << "error: the set i and j are both empty! " << endl; 
return; 
} 
int counti = (root {i 
int countj = (root [j 


] = =EMPTY_ POSITION ? 0: count [root [1]]) : 
] = -EMPTY | POSITION ? 0: count (root [j]1) ; 
// 为 了 保证 root [jj 是 大 集合 , root [i] 是 大 集合 。 
if (counti > countj) 
{ 

int t =i; 

i=j; 

j=t; 
) 


int large = root[j]; 
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int small = root [i]; 
if (small ! =EMPTY_ POSITION) // 小 的 集合 不 是 空 集 
{ 
father [small] = large; 
name {small} = -1; 
count [large] = count [large] + count [small]; 
count [smal1} =0; 
H 
name[large) =k; 
root [i] = EMPTY_ POSITION; 
root [j] = EMPTY_ POSITION; 
root [k] = large; 
} 


void testUnionTreeSet () 


{ 
int root [] = (EMPTY_ POSITION, 4, 7, 10, EMPTY , POSITION, EMPTY_ POSITION, EMPTY_ POSI- 
TION}; 
int name[(] = (EMPTY POSITION, EMPTY. POSITION, EMPTY_ POSITION, EMPTY_ POSITION, 1, 
EMPTY_ POSITION, EMPTY_ POSITION, 2, EMPTY_ POSITION, EMPTY_ POSITION, 3}; 
int count[] ={0,0,0,0,5,0, 0, 4,0, 0, 2}; 
int father [] = (EMPTY, POSITION, 6, 4, 2, EMPTY_ POSITION, 4, 7, 
EMPTY_ POSITION, 6, 2, EMPTY_ POSITION, 10}; 
unionSet (father, name, count, root, 2,3, 4,7); 
cout << "新 集合 4 中 元 素 个 数 :。<< count [root [4]] << endl; 
int setname = find(11, name, father); 
cout << "GK 11 在 集合 " << setname << "中 " << endl; 
setname = find(8, name, father); 
cout << "JOR 8 ÆRA" << setname << "中 * << endl; 
} 
int main () 
{ 
testUnionTreeSet () ; 
system ("pause") ; 
return 0; 


} 
int find(int v, int * name, int * father) 
t 

list«int»1; 


l. clear: 
// 从 节点 v 向 上 扎 潮 ， 知 道 这 个 集合 的 根 顶点 
while(father[v] ! = -1) 


{ 
1. push_ back(v); 
v = father [v]; 
} 
//v 此 刻 已 经 是 根 顶 点 。 
// 调整 向 上 追溯 的 路 径 上 的 所 有 的 顶点 ， 调 整 它们 使 得 它们 全 部 直接 连 在 根 上 ， 
// 减少 之 后 搜索 的 代价 
for(list <int >:: iterator it =1. begin(); it ! -l.end(); it ++) 
{ 
father[* it] =v; 
} 
return name[v]; 


} 


A 19 2-3 树 及 相关 算法 


#include < iostream > 
#include < queue > 
using namespace std; 
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//2-3 树 的 顶点 定义 。 
struct Node23 Tree 
{ 
int lvalue; // 左 子 树 中 最 大 的 元 素 值 
int mvalue; // 中 子 树 中 最 大 的 元 素 值 
int maxValue; // 以 这 个 顶点 为 根 的 树 中 的 最 大 的 元 素 
Node23Tree * sons[3]; 
Node23Tree * father; 
Node23 Tree (int leafValue) 
{ 
this -> lvalue = this ->maxValue = this ->mvalue = leafValue; 
father = NULL; 
for(int i=0; i<3; i++) 
{ 
sons [i] = NULL; 


} 
Node23 Tree (int LValue, int MValue) 
{ 
this -> lvalue =LValue; 
this -»mvalue = MValue; 
for(int i=0; i<3; i++) 
{ 
sons [i] =NULL; 
} 
father = NULL; 
} 
he 
// 判断 一 个 顶点 是 不 是 2-3 树 的 时 顶点 。 
bool is23TreeLeaf (Node23Tree * node) 
{ 
if (node = = NULL) 
{ 
return false; 
} 
return (node -> sons [0] = =NULL && 
node -> sons [1] = =NULL && 
node -> sons [2] = =NULL && 
node -> lvalue = =node ->mvalue) ; 
} 
// T BESTE eR BUR BUR X 
void show23Tree (Node23Tree * root) 
{ 
queue < Node23Tree * >q; 
q push (root); 
while(! q empty ()) 
{ 
if (q front() ! =NULL) 
{ 
cout << q front () -> lvalue << ":" «« q. front () ->mvalue <<" Vt"; 
q push (q. front () -> sons[0]) ; 
q push (q front () -> sons(1]) ; 
q. push (q. front () -> sons (21); 
) 
qa pop: 
} 
cout << endl; 
} 
// 求 一 棵 2-3 树 的 高 度 


int Height23 Tree (Node23Tree * root) 
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int height -0; 
Node23Tree * node = root; 
if (node = - NULL) 
{ 
return height; 
) 
while (true) 
{ 
height ++; 
if (is23TreeLeaf (node)) // node 已 经 是 叶 顶 点 了 
{ 
break; // 跳出 while 循环 
} 
if (node -»sons[0] ! =NULL) 
{ 
node = node -> sons [0]; 
) 
else if (node -»sons[1] ! =NULL) 
{ 
node = node -> sons [1]; 
} 
else 
{ 
node = node -> sons [2]; 
} 
} 
return height; 
} 
// Fig 4.29. Procedure Search 
// 2-3 树 中 的 search HR 
// 输入 : 
// a: 被 查找 的 值 
// root: 查找 开始 的 根 顶 点 
// 输出 : 
"i 返回 包含 a 值 的 叶 顶 点 ， 如 果 找 不 到 符合 条 件 的 叶 顶 点 ， 
// 返回 这 个 值 应 该 被 插 和 人 的 父 项 点 
// 测试 函数 : 
// void testSearct23tree(); 
// 测试 数据 ; 
// 在 下 列 2-3 树 中 查找 值 5。 非 叶 顶点 (a: b), a 是 这 个 顶点 为 根 的 左 子 树 中 最 大 的 值 ， 
// b 是 以 这 个 顶点 为 根 的 中 子 树 中 最 大 的 值 


// (3: 7) 

// / 1 \ 

// (1: 3) (5: 6) (8: 9) 

// FAN FEN FEN 
// 13 N5 6 78 9 N 
// 测试 数据 


Node23Tree * search23tree(int a, Node23Tree * root) 
( 
if (root = =NULL) 
{ 
return NULL; 
} 
for(int i =0; i<3; i++) 
{ 
if (is23TreeLeaf (root -> sons [i]) && root -»sons[i] -> lvalue = =a) 
{ // 找 到 了 含有 a 的 叶 顶 点 。 


return root ~>sons[i]; 
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) 


) 
) 
if(is23TreeLeaf (root ->sons[0}) || 
is23TreeLeaf (root -> sons [1]) |l 
is23TreeLeaf (root -> sons [21)) 
( 
return root; // 在 树 中 找 不 到 a 
} 
if(a« -root -»lvalue) 
{ 
return search23tree(a, root -> sons {0]); 
} 
else if(a< = root -»mvalue) 
{ 
return search23tree (a, root ->sons{1]); 
) 
else 
{ 
return search23tree (a, root -> sons[2]); 


) 


void testSearch23tree() 


( 


} 


// 创建 一 棵 2-3 树 以 供 测试 

Node23Tree * root -new Node23Tree (3, 7); 
root -> Sons [0] =new Node23Tree (1, 3); 
root -> sons [1] = new Node23Tree (5, 6); 
root -> sons[2] = new Node23Tree (8, 9); 


root -> sons [0] -> sons [0] = new Node23Tree (1, 1); 
root -> sons {0] -> sons [1] - new Node23Tree (3, 3); 
root -»sons[1] -> sons [0] = new Node23 Tree (5, 5); 
root -> sons [1] -> sons [1] = new Node23Tree (6, 6); 
root -> sons{1] -> sons [2] = new Node23Tree (7 , 7); 
root -»sons[2] -> sons [0] - new Node23Tree (8, 8) ; 
root -> sons [2] -> sons [1] = new Node23Tree (9, 9); 
Node23Tree * resultNode -search23tree(5, root); 


cout «« resultNode -> lvalue << endl; 
cout << resultNode -> mvalue << endl; 
// 删除 这 棵 2-3 树 所 占用 的 空间 

delete root -> sons [0j -> sons [0]; 
delete root ~> sons [0] -> sons [i]; 
delete root ~>sons[1] -> sons [0]; 
delete root -»sons[1] -»sons[1]; 
delete root -»sons[1] -> sons [2]; 
delete root -> sons [2] -> sons [0]; 
delete root -> sons [2] -> sons [1]; 
delete root -> sons [0] ; 

delete root -> sons [1]; 

delete root -> sons[2]; 

delete root; 


// fig 4.30. 


//%4 treeNode 的 子 结 点 已 经 满 了 之 后 ， 向 treeNode 插入 子 结 点 时 的 算法 


// 输 入 : 


// 
// 
// 
RA 
// 


treeNode: ”将 待 插入 的 值 当 成 子 结 点 插入 到 此 结 点 。 
childToInsert: 待 插入 的 结 点 (和 欲 插入 为 treeNode 的 子 结 点 ， 


但 是 会 造成 treeNode 的 子 结 点 超过 3 ， 需 要 调整 ) 


insertPosition; 插入 到 treeNode 中 子 结 点 的 位 置 ， 


分 别 是 : 0,1,2,3; 


// 输 出 : 


MRA 
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// ”调整 插 人 完成 之 后 的 树 ， 返回 的 是 插入 后 的 新 树 的 根 ， 如 果 没 有 产生 新 的 根 ， 
// 则 返回 NULL 

/ /测试 函 数 : 

// void testAddSon() 

// 测 试 数据 : 

// 在 下 列 2-3 树 中 (5: 6) 结 点 中 插入 4。 非 叶 结 点 (a: b), 

// a 是 这 个 结 点 为 根 的 左 子 树 中 最 大 的 值 ， 

// b 是 以 这 个 结 点 为 根 的 中 子 树 中 最 大 的 值 


// B: 7) 

// / 1 \ 

// (1: 3) (5: 6) (8: 9) 

// /lil\ FEN FEN 

// 13 N5 6 78 9 N 
// 测试 数据 : 

// 在 (5: 6) 结 点 中 插入 4 之 后 的 2-3 树 如 下 : 
// (5: 9) 

// / \ 

// (3: 5) (7: 9) 

// / \ / \ 

H (1: 3) (4:5) (6:7) (8: 9) 


// / \ AN AN / N 
// 1 3 4 5 6 7 8 9 
Node23Tree * addSon(Node23Tree * treeNode, Node23Tree * childToInsert, int insertPosition) 
( 
Node23Tree * pNodes [4]; 
for(int i=0; i<4; i++) 
{ 
if(i<insertPosition) 
{ 
pNodes [i] = treeNode -> sons [i]; 
} 
else if (i = -insertPosition) 
{ 
pNodes [i] = childToInsert; 
) 
else 
( 
pNodes [i] = treeNode -> sons [i -1]; 


) 
Node23Tree * newNode = new Node23 Tree (pNodes [2] -> maxValue, pNodes [3] -> maxValue); 
newNode -> maxValue = pNodes [3] -»maxValue; 
treeNode -> sons [0] = pNodes [0] ; 
treeNode -> lvalue = pNodes [0] -> maxValue; 
pNodes [0] -> father = treeNode; 
treeNode -> sons [1] -pNodes[1i]; 
treeNode -> mvalue = pNodes [1] ->maxValue; 
pNodes [1] -» father = treeNode; 
treeNode -> sons [2] = NULL; 
treeNode -» maxValue = pNodes [1] -> maxValue; 
newNode -> sons [0] = pNodes [2]; 
pNodes (2] -> father = newNode; 
newNode -> sons [1] = pNodes [3]; 
pNodes [3] -> father = newNode ; 
if(treeNode -> father = -NULL) // treeNode 是 根 结 点 ， 没 有 父 结 点 。 
{ 
Node23Tree * root - new Node23 Tree (treeNode -» maxValue, newNode -» maxValue); 
root -> sons[0] - treeNode; 
treeNode -» father - root; 
root -> Sons [1] -newNode; 
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treeNode -> father = root; 
return root; 
} 
else // treeNode 有 父 节点 。 
{ 
if (treeNode -> father -> sons [0] = =NULL || 
treeNode -> father -> sons[1] = =NULL | 
treeNode -> father -> sons (2] = = NULL) 


// father 的 子 结 点 没有 满 ， 还 可 以 直接 插 人 
if (treeNode = -treeNode -> father — sons [0]) 
{ 
if (treeNode -> father — sons[1] = - NULL) 
{ 
newNode -> father = treeNode -» father; 
treeNode -> father -> sons [1] =newNode; 
treeNode -> father ->mvalue = newNode -> maxValue; 
) 
else 
( 
treeNode -> father -> sons [2] = treeNode -> father -> sons [1]; 
treeNode -> father -> sons [1] = newNode; 
treeNode -> father -» mvalue = newNode -> maxValue; 
newNode -» father - treeNode -» father; 


) 


else if (treeNode -> father -> sons[1] = = treeNode) 
{ 

if(treeNode -> father -> sons [2] = = NULL) 

{ 


treeNode -> father -> sons [2] =newNode; 
newNode -> father = treeNode -> father; 
} 
else 
{ 


treeNode -> father -> sons [0] = treeNode -> father -> sons [1]; 
treeNode -> father -> Sons [1] = treeNode -> father -> sons [2]; 
treeNode -> father -> sons [2] = newNode; 
newNode -> father = treeNode -> father; 
} 
treeNode -> father -» maxValue = newNode -> maxValue; 
} 
else //(treeNode = -treeNode -> father -> sons [2] ) 
{ 
if (treeNode -> father -> sons [0] = - NULL) 
{ 
treeNode -> father -> sons [0] = treeNode -> father -> sons [1]; 
treeNode -> father -> sons [1] = treeNode -> father -> sons [2] ; 
treeNode -> father -> sons [2] =newNode; 
newNode -» father - treeNode -» father; 
) 
else // treeNode -> father -> sons[1] = - NULL 
{ 
treeNode -> father -> sons [1] = treeNode -> father -> sons (21: 
treeNode -> father -> sons [2] = newNode; 
newNode -» father - treeNode -» father; 
) 
treeNode -> father -» maxValue = newNode -> maxValue; 
) 
return NULL; 
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) 
else // treeNode -> father 的 子 结 点 完全 已 经 满 了 ， 必 须 递归 调用 addson 调整 插入 
( 
// insertPos 是 插入 newNode 的 位 置 ， 应 该 刚好 是 creeNode 的 右 一 个 结 点 。 
int insertPos -0; 7 
if (treeNode = -treeNode -> father -> sons [0] ) 
{ 
insertPos -1; 
) 
else if (treeNode = = treeNode -> father -> sons (1]) 
( 
insertPos -2; 
) 
else // treeNode = = treeNode -> father > sons [2] 
{ 
insertPos =3; 
} 
return addSon (treeNode -> father, newNode, insertPos); 


à 


) 
void testAddSon() 
{ 
// 创建 一 棵 2-3 树 以 供 测试 
Node23Tree * root - new Node23Tree(3, 7); 
root ->maxValue =9; 
root -> sons [0] =new Node23Tree(1, 3); 
root ->sons[0] -»maxValue =3; 
root -> sons [0] -> father = root; 
root -> sons [i] =new Node23Tree(5, 6); 
root -> sons [1] -»maxValue -7; 
root -> sons [1] -> father = root; 
root -> sons [2] =new Node23 Tree (8, 9); 
root ->sons [2] -»maxValue =9; 
root ~>sons [2] -> father = root; 
0] -> sons [0] =new Node23Tree (1); 
root -> sons [0] -> sons [0] -> father = root ->sons [0]; 
root -> sons [0] -> sons [1] =new Node23Tree (3) ; 
root -> sons [0] ->sons[{1] -> father = root -» sons [0] ; 
root -> sonsí1] -> sons [0] =new Node23Tree (5); 
root -> sons [1] ->sons[0] -> father =root ->sons{1]; 
root -> sons [1] ->sons{1] =new Node23Tree (6); 
root -»sons[1] ->sons[1] -> father = root ->sons[1]; 
root -> sons [1] -> sons [2] = new Node23Tree (7) ; 
root -> sons [i] -> sons [2] -> father = root ->sons[1]; 
root -> sons {2] -> sons [0] =new Node23 Tree (8) ; 
root -> sons [2] ->sons[0] -> father = root -» sons [2]; 
root -> sons [2] -> sons [1] =new Node23 Tree (9) ; 
root -> Sons [2] -> sons [1] -> father = root -» sons [2]; 
show23Tree (root); 
cout << "the height of the tree is : " ««Height23Tree (root) << endl; 
Node23Tree * curNode = root -> sons[1]; 
Node23Tree * newNode = new Node23 Tree (4); 
Node23Tree * newRoot = addSon(curNode, newNode, 0); 
if(newRoot ! zNULL) 
( 


root -» sons 

















root = newRoot; 


show23Tree (root); 
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cout << "the height of the tree is : " ««Height23Tree (root) << endl; 
} 
//Fig. 4.32 Procedure IMPLANT 


// The: 合并 两 棵 2-3 树 


// WA: 

// treel: 待 合并 的 第 一 棵 树 的 根 结 点 

// tree2;: 待 合并 的 第 二 棵 树 的 根 结 点 

//( 两 棵 树 必 须 满足 条 件 都 是 2-3 WH tree2 的 所 有 结 点 值 都 比 treel PA) 
// 输出 : 

// 返回 合并 后 的 新 的 树 的 根 结 点 

// 测试 函数 : 

// void testImplant23Tree() 

// 测试 数据 : treel: tree2: 

// (3: 7) (10: 12) 
/1 / | \ / | \ 
// (1: 3) (5: 6) (8: 9) 1012 13 
// LAN LEN / | AN 

// 1.3 N5 6 78 9 N 

// 测试 结果 ; j 
// (7: 13) 

// / N 

AA (3: 7) (9: 13) 

/7 / N / \ 

// (1: 3) (5:6) (8:9) (10: 12) 


// / N LEA 7 \ / \ 
// 1 3 5 67 8 9 10 12 13 
Node23Tree * implant23Tree(Node23Tree * treel, Node23Tree * tree2) 
{ 

int hl =Height23Tree (treel); 

int h2 =Height23 Tree (tree2); 

if (hl = =h2) // 两 棵 树 的 高 度 一 样 

// 使 其 同时 成 为 一 个 新 的 根 结 点 的 子 结 点 之 后 仍然 可 以 保持 平衡 


Node23Tree * root -new Node23Tree (treel -> maxValue, tree2 -»maxValue); 
return root; // 完成 合并 
) 
else 
{ 
// 保证 ti 的 高 度 比 t2 要 大 
Node23Tree * t1 -NULL; 
Node23Tree * t2 NULL; 
bool isreversed - false; 
if(hl»h2) 
{ 
tli =treel; 
t2 =tree2; 
} 
else 
{ 
isreversed = true; 
tl =tree2; 
t2 =treel; 
int temp -hl; 
hi =<h2; 
h2 = temp; 
} 
int height =1; 
Node23Tree * node-t1; 
int rightMost -2; 
while (true) 
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if (height > =hl -h2) 
( 

break; 
) 


// MUR treel 和 tree2 位 置 没有 反 过 来 ， 则 沿 着 tl 最 右边 的 路 径 ， 向 下 一 层 
// 如 果 treel 和 tree2 位 置 反 了 过 来 ， 则 沿 着 tl 最 左边 的 路 径 ， 向 下 一 层 


if (isreversed) 
{ 
rightMost =0; 
} 
if (tl -> sons [rightMost] ! =NULL) 
{ 
node = t1 -> sons[rightMost]; 
} 
else 
{ 
node -tl -> sons {1]; 
} 
height ++; 
) 
// node 现在 就 是 t2 要 插入 的 位 置 ， 将 co 的 根 结 点 作为 node 的 最 右 的 子 结 点 插入 
// (如果 treel 和 tree2 曾经 调换 位 置 ， 则 是 最 左 的 子 结 点 ) 


if(node-»sons[0] ! =NULL && 
node -»sons[1] ! =NULL && 
node -> sons [2] ! =NULL) 


//node 所 有 的 子 结 点 已 经 满 了 ， 需 要 调整 插 人 
if (isreversed) 
{ 
return addSon (node, t2, 0); 
} 
else 
{ 
return addSon (node, t2, 3); 
} 
} 
// node 还 有 空 的 子 结 点 可 以 插入 
int leftMost =0; 
if (isreversed) 
{ 
leftMost -2; 
) 
if (node -> sons [leftMost] = = NULL) 
( 
node -> sons [leftMost] = node -> sons [1]; 
node -> sons [1] 2 node -> sons [rightMost]; 
) 
else if (node -> sons [1] = - NULL) 
( 
node -> sons [1] - node -> sons [rightMost]; 
node -> mvalue = node -> sons [rightMost] -»maxValue; 
) 
// 此 刻 node -> sons [rightmost] 一 定 为 空 ， 可 以 揪 人 
node -> sons [rightMost] -t2; 
if(isreversed) // leftmost -2; rightmost -0; 
{ 
node -» mvalue = node -> sons [1] ->maxValue; 
node -> lvalue -t2 ~>maxValue; 
node -»maxValue = node -> sons [2 ] ->maxValue; 
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) 


) 


else // rightmost -2; leftmost -0; 


{ 


node -»maxValue =t2 -»maxValue; 
node -> lvalue = node -> sons [0] -» maxValue; 
node -> mvalue = node -> sons [1] -»maxValue; 


) 


t2 -» father - node; 


// 向 上 回溯 一 直到 根 ， 更 新 maxvalue fü 


while(node ! zNULL) 
{ 
int max = node -> maxValue; 
node = node -> father; 
if (mode ! =NULL) 
{ 
node -> maxValue = max; 
} 
} 
return tl; 


void test Implant23 Tree (} 


( 


// 创建 2-3 BW treel 以 供 测试 
treel = new Node23Tree (3, 7); 
treel ->maxValue =9; 


Node23Tree * 


treel -» sons 


treel -> sons[ 
treel -»sons[ 


treel -» sons 


treel ->sons[ 


treel -> sons 
treel -> sons 
treel -» sons 
treel -» sons 


treel -> sons[ 


treel -> sons 


treel -»sons[ 


treel -» sons 
treel -» sons 
treel — sons 
treel -> sons 


treel -»sons[ 
treel -> sons[ 
treel -> sons [ 


treel -» sons 
treel -» sons 
treel -> sons 


treel -> sons[ 


0 


Tt) TO PRO ON B OP P PE pP OoOOoOoOt)tlimÓpd^iHooo 








] -»sons[1] -> father -treel -> sons [0]; 
] -> sons [0] = new Node23Tree (5) ; 


] -> sons [2] -> father = treel -> sons [1] 


znew Node23Tree (1, 3); 
-»maxValue =3; 


]-»father-treel; 
] = new.Node23Tree (5, 6); 
] ->maxValue -7; 


-> father -treel; 

=new Node23Tree (8, 9); 
->maxValue =9; 

-» father -treel; 

~> sons [0] = new Node23Tree (1); 
-> sons {0} -> father = treel ->sons [0]; 
-> sons [1] =new Node23 Tree (3); 


-> sons [0] -> father -treel -> sons [1]; 
->sons{l] =new Node23Tree (6); 
-»sons[1] -> father -treel ->sons[1]; 
-> sons [2] = new Node23Tree (7) ; 





-> sons [0] = new Node23 Tree (8) ; 
-> sons (0] -> father = treel -> sons [2]; 


] -> sons [1] = new Node23 Tree (9) ; 





-> sons [1] -> father -treel -> sons [2]; 


show23Tree(treel); 

/ /创建 2-3 BE tree2 以 供 测试 

tree2 =new Node23Tree (10, 12); 
tree2 -»maxValue -13; 


Node23Tree * 


tree2 -> sons [0] » new Node23 Tree (10); 
tree? ->sons[1] = new Node23Tree (12); 
tree2 -> sons [2] = new Node23Tree (13); 
for(int i=0; i<3; i++) 

{ 


tree2 ->sons[i] -> father =tree2; 


BRA 
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show23 Tree (tree2); 
Node23Tree * resultRoot =implant23Tree(treel, tree2); 
show23 Tree (resultRoot) ; 
} 
// Fig. 4.34 Procedure to split a 2-3 tree. 
// 2-3 树 的 分 裂 算法 。 
// 输入 : 
/7/ value: 48 2-3 树 的 临界 值 ， 将 value 的 结 点 放 在 分 裂 后 的 -…- 棵 子 树 中 ， 
// 将 > value 的 结 点 放 在 分 裂 后 的 另 一 棵 子 树 中 
// tree: 被 分 裂 的 2-3 树 的 根 结 点 
// 输出 : 
// subtreel: ”分裂 成 两 棵 树 后 的 第 一 樟树 (包括 了 < = value 的 结 点 ) 的 根 结 点 
// subtree2 :分裂 成 两 棵 树 后 的 第 二 棵 树 ( 包括 了 > value 的 结 点 ) 的 根 结 点 
// Wiki: 
// void testDevide23Tree() 
// 测试 数据 : 
// 被 分 裂 的 2-3 树 如 下 所 示 : 分裂 的 临界 值 是 6 
// (7: 13) 
// / N 
// (3: 7) (9: 13) 
// / \ / \ 
// (1: 3) (5:6) (8:9) (10: 12) 
// / N LAEN 7 \ / N 
/ f 1 3 5 67 8 9 10 12 13 
// 运行 结果 : 
// 分裂 后 的 两 棵 树 分 别 如 下 。 
// (3: 6) (9: 13) 
// / \ / \ 
// (1: 3) (5: 6) (7: 8) (10: 12) 
// / N / N / | \ 4 | N 
// 1 3 85 6 7 8 9 1012 13 


void devide23Tree(int value, Node23Tree * tree, Node23Tree * & subtreel, Node23Tree * & sub 
tree2) 


( 
queue « Node23Tree * »treelessequalvalue; 

// 存放 删除 后 所 有 结 点 小 于 等 于 value 的 树 的 根 
queue <Node23Tree * >treegreatervalue; // 存放 删除 后 所 有 结 点 大 于 等 于 value 的 树 的 根 
Node23Tree * node =tree; 

// 从 tree 的 根 结 点 一 直到 值 为 value 的 叶 结 点 ， 将 这 条 路 径 上 的 所 有 的 结 点 都 删除 
while(! is23TreeLeaf (node) | node = -NULL) 
{ 
Node23Tree * back =node; 
int sonIdx-0; 
// 移动 到 路 径 的 下 一 个 结 点 。 
if (value < -node -> lvalue) 
{ 
sonIdx =0; 
} 
else if (value < =node ->mvalue) 
{ 
sonldx-1; 
) 
else 
{ 
sonidx =2; 
} 
node = node -> sons [sonIdx] ; 
for(int i =0; i«3; i ++) 
{ 
if (back ->sons[i] ! =NULL) 
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back -> sons [i] -> father = NULL; 


} 
for(int í =0; i<sonIdx; i ++) 
{ 
if (back ->sons[i] ! =NULL) 
{ 
treelessequalvalue. push (back -> sons {i]); 
} 
} 
if (is23TreeLeaf (node)) // 是 叶 结 点 
{ 
treelessequalvalue. push (node) ; 
// 叶 结 点 不 会 被 删除 ， 所 以 作为 一 个 子 树 放 到 临时 存放 空间 
) 
for(int i =sonIdx+1; i«3; i++) 
{ 
if (back ->sons[i] ! -NULL) 
{ 
treegreatervalue. push (back -> sons [i]); 
} 
} 
delete back; // 删除 这 条 路 径 中 的 当前 结 点 (不 是 时 结 点 ) 
) 
. while (treegreatervalue size() >1) 
( 
// 将 这 些 子 树 合并 
Node23Tree * nodel -treegreatervalue. front(); 
treegreatervalue. pop(); 
Node23Tree * node2 -treegreatervalue. front (); 
treegreatervalue. pop(); 
if (nodel -> lvalue < =node2 -> lvalue) 
{ 
treegreatervalue. push (implant23Tree (nodel, node2)); 
} 
else 
{ 
treegreatervalue. push (implant23Tree (node2, nodel)); 


) 
subtree2 = treegreatervalue. front(); 
treegreatervalue. pop(); 
while (treelessequalvalue size() >1) 
{ 
// 将 这 些 子 树 合并 
Node23Tree * nodel -treelessequalvalue. front (); 
treelessequalvalue. pop(); 
Node23Tree * node2 -treelessequalvalue. front (); 
treelessequalvalue. pop(); 
if (nodel -> lvalue < =node2 -> lvalue) 
{ 
treelessequalvalue. push (implant23 Tree (nodel, node2)); 
} 
else 
{ 
treelessequalvalue. push (implant23 Tree (node2, nodel)); 


} 
subtreel = treelessequalvalue. front (); 
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) 


treelessequalvalue. pop(); 


void testDevide23Tree() 


( 


int 


// Br — 2-3 树 以 供 测试 
Node23Tree * root -new Node23Tree(7, 13); 
root -»maxValue -13; 
root -> sons [0] =new Node23Tree(3, 7); 
root -»sons[0] -»maxValue -7; 
root -> Sons [0] -» father - root; 
root -> Sons {1] =new Node23 Tree (9, 13); 
root -> sons [1] -»maxValue =13; 
-» father - root; 
-> sons [0] = new Node23Tree(1, 3); 
-> sons [0] -»maxValue =3; 


root -> sons [1] 
root -> sons [0] 
root -> sons [0] 
root -> sons [0] 
root -> sons [0] 
root ->sons [0] 


root -> sons [0 


root ->sons [1] 


root -> sons [1 


root -> sons [1] 
root -> sons [1] 
root -> sons [1] 
root -> sons [1] 


root -> sons [0 


root -> sons [0] 
root -» sons [0] 
root -» sons [0] 
root ->sons [0] 
root -» sons [0] 
root -> sons [0] 
root -» sons[0] 
root -> sons [0] 
root -> sons [0] 
root -> sons[1] 
root -> sons{1] 
root -> sons [1] 
root -> sons [1] 


root -> sons {1 


root -> sons [1] 


root -> sons [1 


root -> Sons [1] 


root -> sons [1 





root -> sons [1] 








-» sons 


[0] -» father - 


root -» sons [0] ; 


-> sons [1] = new Node23Tree (5, 6); 

-> sons [1] -»maxValue =7; 

-> sons [1] -> father = root -» sons [0] ; 
-> sons [0] = new Node23Tree (8, 9); 


~> Sons 
—» sons 
-» sons 
-» sons 
-> sons 
-> sons 


[0] -> sons (0] 


0] ->maxValue =9; 
[0] -> father = 
{1] =new Node23Tree (10, 12); 
[1] ->maxValue -13; 

[1] -> father = 


root -> sons[1]; 


root -> sons [i]; 
= new Node23Tree(i); 


-> sons [0] -> sons [0] -> father = root -> sons [0] -> sons [0]; 


-> Sons 
~> SOnS 
-» sons 
-> Sons 
-> Sons 
-» sons 
-> Sons 
-» SOnS 
-> Sons 
~> Sons 
-> Sons 
~> sons 
-> SONS 
-» Sons 
-> Sons 
-> sons 
-» Sons 
-> sons 


show23Tree (root); 


Node23Tree * 


[0] -> sons [1] 
0] -> sons [1] 
[1] -> sons{0] 
[1] -> sons [O 
[1] - sons[1] 
[1] -> sons fi] 
[1] -» sons [2] 
[1] -»sons[2] 
[0] -> sons [0] 
[0] -> sons [0] 
01 -> sons [1] 
[0] -> sons [1 
[1] -» sons [0] 
1] -> sons [0] 
[1] -»sons[1 
[1] -> sons {1] 
[1] -> sons [2] 
[1] -> sons [2] 











subrootl = NULL; 


Node23Tree * subroot2 =NULL; 
devide23Tree (6, root, subrooti, subroot2) ; 
cout << "come here! " << endl; 
show23 Tree (subroot1); 
show23 Tree (subroot2); 


main() 


testSearch23tree(); 


testAddSon (); 


test Implant23Tree (); 
test Devide23 Tree (); 
system ("pause"); 


= new Node23 Tree (3); 

-> father = root ->sons[0] ->sons[0]; 
= new Node23 Tree (5); 

-> father = root -> sons(0] -»sons[1]; 
=new Node23Tree (6); 

-> father = root -> sons[0] -> sons [1]; 
= new Node23Tree (7); f 

-> father = root -> sons [0] ->sons[1]; 
=new Node23Tree (8); 

-> father = root -> sons[1] -> sons[0]; 
=new Node23Tree (9); 

-> father = root -»sons[1] -> sons [0]; 
= new Node23 Tree (10); 

-> father = root -> sons [1] ->sons[1]; 
=new Node23Tree (12); 

-> father = root -> sons [1] -»sons[1]; 
=new Node23 Tree (13); 

-> father = root -»sons[1] ->sons{1]; 
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return 0; 


) 


A. 20 集合 划分 的 算法 


#include < iostream > 
#include < Vector > 
#include < set > 
using namespace std; 


int f. inverse (int input, int setsize) 
( 
return (input +1) $ setsize; 
) 
//Fig 4.35 Partitioning algorithm 
// 集合 划分 的 算法 实现 


// 输入 : 

HH blocks; 所 有 集合 的 列表 

// 输出 : 

// 划分 后 的 集合 

// ARKKA.: 

// void testPartitionSet() 

/1 根据 E_ inverse 规则 来 划分 集合 

// 测试 数据 : 

/1 blockl = {0, 1, 2,3, 4, 5}; block2 ={ 6, 7 }; block3 = 18); 
// 测试 结果 : 


// blockl = {4, 5}; block2 = (6, 7}; block3 = (8); block4 = (0); block5 = (1); block6 = (2, 3); 
void partitionSet (vector «set «int > >& blocks) 
{ 
vector «int »waitinglist; 
for(int i =0; i«blocks. size(); i++) 
{ 
waitinglist. push_ back (i); 
} 
int endBlockID - blocks. size() -1; 
set < int > inverse; 
while(! waitinglist. empty ()) 
{ 
int i =waitinglist. back(); 
waitinglist. pop_ back() ; 
for (set «int >:: iterator it - blocks. at (i). begin(); 
it ! =blocks. at (i). end(); 
it ++) 


inverse. insert (f_ inverse(* it, blocks. at (i). size())); 
} 
// 对 于 blocks 里 面 的 每 一 个 block 
for(int j =0; j < =endBlockID; j ++) 
{ 
set <int >newblock; 
newblock. clear (); 
for(set«int»:: iterator iit - blocks. at (3). begin(); 


iit ! zblocks.at(j). end(); 
) 
( 
if (inverse. find(* iit) ! =inverse end()) 
( 


// blocks[j] X inverse 不 为 空 


newblock. insert(* iit); // 新 的 集合 里 面 放 block (j]% inverse MILK 
set <int >:: iterator deleteit =iit; 
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) 


iit ++; 

blocks. at(j). erase (deleteit); 
) 
else 
{ 


Lit ++; 
} 
} 


if (blocks. at (j). size() >0// blocks[j] 不 是 inverse HTM 
&& newblock. size() >0) // blocks[j] 与 inverse 的 交集 不 是 空 集 


zwaitinglist. end(); vecIt ++) 


{ 
blocks. push_ back (newblock) ; 
endBlockID ++ ; 
vector «int »:: iterator vecIt -waitinglist. begin(); 
for (vecīt =waitinglist. begin(); vecIt ! 
{ 
if(* vecI = =j) // j. 在 等 待 队列 中 
{ 
waitinglist. push_ back (endBlockID); 
break; 
} 
} 
if (vecIt = -waitinglist. end()) // j 不 在 等 待 队列 中 ; 
{ 
if (blocks. at (j). size() < =newblock size()) 
{ 
waitinglist. push_ back(j); 
} 
else 
{ 
waitinglist. push, back (endBlockID) ; 
} 
} 
} 


if (blocks. at (j). size() = =0) 
{ 
blocks [j] =newblock; 


void testPartitionSet() 


{ 


set «int »blockl; 
for(int i=0 ; i<6; i++) 
{ 
blockt. insert (i); 
) 
set «int >block2; 
block2. insert (6); 
block2. insert (7); 
set <int >block3; 
block3. insert (8); 
vector <set <int >> blocks; 
blocks. push__ back (blockl); 
blocks. push, back (block2); 
blocks. push_ back (block3) ; 


int i=0; 


for (vector < set <int > >:: iterator it - blocks. begin(); it ! 


=blocks. end(); it ++) 
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cout << "set" << i ++ <<": " «cendl; 
for (Set < int > :: iterator setit -it ->begin(); setit ! 
{ 
cout <<* setit <<" Vt"; 
} 
cout << endl; 
} 
partitionSet (blocks); 
i=0; 
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-it-»end(); setit ++) 


for (vector <set <int > >:: iterator it =blocks. begin(); it ! =blocks. end(); it ++) 


{ 
cout << "set" «ci ++ <<": "<< endl; 
for(set < int >:: iterator setit =it ->begin(); setit ! 
{ 


cout <<* setit <<"\t"; 


} 
cout << endl; 
} 
} 
int main () 
{ 
testPartitionSet (); 
system ("pause"); 
return 0; 
} 


A.21 最 小 生成 树 算法 


#include < iostream > 
#include < list > 
#include <vector > 
#include <algorithm> 
#include «stack» 
#include «stdlib h> 
using namespace std; 
struct Edge 
{ 
int start; 
int end; 
float weight; 
Edge (int _ start, int, end, float _ weight) 
{ 
start =_ start; 
end = _ end; 
weight =_ weight; 
} 
bool operator < (const Edge & e) const 
{ 
return this -> weight <e. weight; 
} 
bool operator > (const Edge & e) const 
{ 
return this -» weight » e weight; 
) 
bool operator » - (const Edge & e) const 
{ 
return this ->weight > =e. weight; 
} 
bool operator < = (const Edge & e) const 


=it ->end(); setit ++) 


HCC HM 代码 329 





return this -» weight « - e weight; 
) 
bool operator = = (const Edge & e) const 
{ 
return (this ->weight = =e weight && 
this ->start = =e start && 
this ->end= =e end); 


}; 
int find(int v, int * name, int * father); 
void unionSet(int * father, int * name, int * count, int * root, 
int i, int j, int k, int setnamerange); 
// Fig. 5.2 
// 最 小 生成 树 的 生成 
// 输入 : 
// v: 厌 图 的 点 集 (A 1 到 nv -1) 
HH nv:” 原 图 的 点 的 数目 
// E: 原 图 的 边 集 
// 输出 : 
// 生成 的 最 小 生成 树 边 集 为 T， 点 集 仍然 为 V 
// 测试 函数 ; 
// testBuildMinimunCostSpanningTree() 
// 测试 数据 : 
// 原 图 由 4 点 组 成 : 0,1, 2, 3, 4, 5, 6 
// 20 
// v0------- vi 
// /\ AN 
// 23/ \1 4/ \15 
// /36 \ /9 \ 
// vb------- v6------- v2 
// N / N / 
// 28 \ /25 X16 /3 
// \/ 317 \/ 
// v4-------- v3 
// 测试 结果 : 
// 生成 树 点 集 与 原 图 一 致 : 0, 1, 2, 3, 4, 5, 6 
// v0 v1 
// AN 
// 23/ M1 a/ 
// / N / 9 
// v5 v6-----+-- v2 
// / 
// /3 
tf 17 / 
// v4--+-----+--- v3 
void buildMinimunCostSpanningTree(int * V, int nV, vector «Edge >& E, vector < Edge » & T) 
{ 
T. clear (); 
// 初始 化 一 个 集合 的 集合 
int * father =new int [nV]; 
int * root -new int[nV]; 
int * count =new int [nV]; 
int * name - new int [nV]; 
// 每 个 点 都 被 初始 化 为 一 个 单独 的 点 集 。 
for(int i=0; i<nv; i ++) 
{ 
father[i]- -1; 
count [i] -1; // 每 个 集合 i 中 都 只 有 i 这 一 个 元 素 
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) 


root [i] =i; // 集合 i 的 根 节 点 就 是 点 i; 

name[i] =i; 
} 
// 用 堆 的 形式 来 存放 图 中 所 有 的 边 E; 
make , heap (E. begin(), E end() , greater < Edge > ()); 
vector «Edge »:: iterator edgeEndIt = E end(); 
while (true) 
{ 


if (count [root [find(0, name, father)]] > «nV || edgeEndIt = =E begin()) 


{ // 所 有 的 点 都 在 同一 个 点 集中 了 ， 表 示 T'POESBEMET RADA 
break; 

) 

// 有 从 也 中 选 出 权重 最 小 的 一 条 边 (v，w) ; 

Edge e =E at (0); 

JAB PRR (v, w); 

pop_ heap(E begin(), edgeEndIt, greater < Edge > ()); 

edgeEndIt ~- -; 

int Wl = find(e. start, name, father); 

int W2 = find (e. end, name, father); 

if (Wl ! -W2) //v Mw 在 VSs PRARLAR wi 和 也 中 

{ 
//FAS SE wi union w2 avs PHAM w Mw; 


unionSet (father, name, count, root, Wl, W2, W2, nV); 


// 将 边 (v, w) BAIT B; 
T. push_ back (e); 


} 


void testBuildMinimunCostSpanningTree () 


( 


int V] 2(0, 1,2, 3, 4, 5, 6}; 
vector < Edge > E; 

Edge e01 (0, 1, 20); 

Edge e12 (1, 2, 15); 


Edge e23 (2, 3, 3); 
Edge e34 (3, 4, 17); 
Edge e45 (4, 5, 28); 
Edge e50 (5, 0, 23); 
Edge e06 (0, 6, 1); 
Edge e16(1, 6, 4); 
Edge e26 (2, 6, 9); 
Edge e36 (3, 6, 16); 
Edge e46 (4, 6, 25); 


Edge e56 (5, 6, 36); 

E. push, back (e01); 

E. push_ back(e12); 

E. push_ back (e23); 

E. push, back (e34); 

E. push_ back (e45) ; 

E. push, back (e50) ; 

E. push_ back(e06) ; 

E. push_ back (e16); 

E. push_ back (e26); 

E. push_ back (e36) ; 

E. push_ back (e46); 

E. push_ back (e56); 

vector « Edge » tree; 

tree. clear(); 

buildMinimunCostSpanningTree (V, 7, E, tree); 
cout << "In the min cost spanning tree built: " «« endl; 
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for (vector <Edge>:: iterator it =tree begin(); it ! -tree end(); it ++) 
{ 
cout «c * (^ << it ->start <<","<<it -» end <<"): "<< it ->weight << endl; 
} 
} 
int main () 
{ 
testBuildMinimunCostSpanningTree(); 
system (*pause") ; 
return 0; 
} 
// Pig 4.18 Executing instruction FIND(i) 
// 在 集合 中 查找 某 个 元 素 所 在 的 集合 名 (集合 用 树 的 结构 来 表示 ) 
// ÑA: 
// vo: 查找 结 点 v 
// name: 数组， 存放 每 个 根 结 点 对 应 的 集合 的 名 称 
// name [v] SUR I £f f Jy v 的 集合 的 名 称 
// father; 数组 ， 存 放 每 个 结 点 的 父 结 点 ， 如 father [v] 表 示 结 点 v 的 父 结 点 


// Vi 所 属于 的 集合 名 将 被 打印 到 控制 台 ( console) 上， 并 返回 vi 所 属于 的 集合 名 
// 测试 数据 ; 给 定 集合 : 


// 7 

// 7 \ 

// 5 2 

// / 

// 1 

// / 

// 3 

// 查找 v = 3; 
// 测试 结果 : 找 出 根 结 点 7， 打 印 出 集合 名 3 ， 并 将 集合 调整 为 一 下 结构 
// 7 

// /NNSN 
// 5 213 


int find(int v, int * name, int * father) 
{ 


list <int >1; 


1. clear(); 
// 从 节点 v ME, DMPA MRA. 
while(father[v] ! = -1) 


{ 
1. push_ back (v); 
v = father [v]; 
) 
//v 此 刻 已 经 是 根 结 点 
// 调整 向 上 和 追 澳 的 路 径 上 的 所 有 的 结 点 ， 调 整 它们 使 得 它们 全 部 直接 连 在 根 上 ， 
// 减少 之 后 搜索 的 代价 
for(list«int»:: iteratorit-l begin(); it ! -l.end(); it ++) 
{ 
father[* it] =v; 
} 
return name[v]; 
) 
// fig 4.19 Executing instruction UNION(i, j, k) 
// 集合 求 并 算法 实现 (集合 用 树 结构 来 表示 ) 
// WA: 
// father: 数组， 存放 每 个 结 点 的 父 结 点 ， 如 father [v] 表示 结 点 v 的 父 结 点 
// name: 数组 ， 存 放 每 个 根 结 点 对 应 的 集合 的 名 称 
// nane [v] 表示 根 结 点 为 v 的 集合 的 名 称 
// count: 数组 ， 存 放 每 个 根 结 点 代表 的 集合 中 的 元 素 的 个 数 
// count fv] 表 示 根 结 点 是 v 的 集合 的 元 素 的 个 数 


// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
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root: 数组， 存放 每 个 集合 对 应 的 根 结 点 。root [i] 表 示 集 合 i 的 根 结 点 v 
i, j: 给 外 部 名 称 为 i 和 j 的 集合 求 并 
k: 求 并 后 的 集合 外 部 名 称 
setnamerange; 集合 名 的 范围 ， 只 能 从 0 Sl (setnamerange -1) 
输出 : 
运行 结束 后 的 数组 中 存放 的 就 是 求 并 之 后 的 结果 
测试 数据 : 
求 并 之 前 的 集合 如 下 : 
集合 1: 4 集合 2: 7 合 3: 10 
/ N / 
2 5 6 11 
/\ /\ 
3 9 1 8 
将 集合 2 和 集合 3 求 并 ， 求 并 后 的 新 集合 为 4 
测试 结果 : 
集合 1 不 变 ， 集 合 4 7 
AN 
6 10 
LN \ 
1 8 11 


void unionSet(int * father, int * name, int * count, int * root, int i, int j, int k, int setna- 
merange) 


( 


) 
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if(i» -setnamerange || j > =setnamerange || k > -setnamerange || 
i«0 | j«O || k<0) 
{ 
cout << "the set name is out of the range. "<< endl; 
cout << "please use the set name among 0 to * << setnamerange -1 << endl; 
return; ` 
) 
if(root[i] = = -1 && root[j] = = -1) 
( 
cout << "error: the set i and j are both empty! " << endl; 
return; 
) " 
int counti = root [i] = = -1 ? 0: count [root [i]]; 
int countj =root[j] = = -1 ?0: count (root[i]]; 
if (counti > count j) 


( 


i 


int t =i; 
i=j; 
j=t; 


} 
int large = root [j]; 
int small = root [i]; 
if (small ! = -1) // 小 的 集合 不 是 空 集 
( 
father [small] = large; 
name[small]- -1; 
count [small] =0; 
} 
count [large] = count [large] + count [small]; 
name [large] =k; 
root[i]- -1; 
root [j] = -1; 
root[k] -large; 


图 的 深度 优先 遍历 算法 


#include < iostream > 
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#include < vector > 
using namespace std; 
struct Edge 
{ 
int start; 
int end; 
float weight; 
Edge (int _ start, int _ end, float _ weight) 
{ 
start =_ start; 
end =_ end; 
weight =__ weight; 
} 
bool operator < (const Edge & e) const 
{ 
return this ->weight < e. weight; 
} 
bool operator > (const Edge & e) const 
{ 
return this -» weight >e weight; 
) 
bool operator » - (const Edge & e) const 
t 
return this -» weight > =e. weight; 
} 
bool operator < = (const Edge & e) const 
{ 
return this ->weight < =e. weight; 
} 
bool operator = = (const Edge & e) const 
{ 
return (this -» weight = =e weight && 
this -> start = =e start k& 
this -> end = =e end); 


}; 

// fig 5.6 

// 图 的 深度 优先 遍历 的 算法 实现 

// 输入 : 

// vertex: 图 中 开始 搜索 的 顶点 

// adjacentList: 数组 ， 存 放 所 有 顶点 的 邻接 点 列表 

// adjacentList [i] 表 示 顶 点 i 的 所 有 邻接 点 的 列表 

// isoldi: 布尔 值 数 组 ， 存 放 一 个 顶点 是 否 已 经 被 访问 过 了 ， 

// 如 果 顶 点 [i] 已 经 访问 过 则 isola [i] 值 为 true， 否 则 值 为 false; 
// nVextex; 图 中 顶点 的 数目 ， 顶 点 编号 从 0 到 (nvertex -1); 


// tree; 深度 优先 树 的 边 集 (点 集 和 原来 的 图 的 点 集 一 致 ) 
// MRKA: 

// void testSearchDepthFirst () 
// 测试 数据 : 

// ”遍历 的 起 点 是 vo 

// ” 原 图 为 如 下 : 

ff (v3) 

// FEN 

// | N 

// | N 

// (v4) - - (v0) - - (v1) 
// | / \ | 

/f | / N | 


333 





334 MRA 





// | / VI 

// (v5) (v2) 

// 测试 结果 : 

// ”生成 的 深度 优先 遍历 树 : ( 树 的 根 是 v0) 

// (v3) 

// N 

// \ 

// N 

// (v4) - - (v0) ~ - (v1) 

/4/ | | 

// | | 

// | i 

/7 (v5) (v2) 

void searchDepthFirst (int vertex, vector < int > * adjacentList, bool * isOld, int nVertex, 
vector « Edge >& tree ) 


H 
if (vertex > -nVertex) 
{ 
return; 
} 
isOld(vertex] = true; 
for (vector < int >:: iterator it = adjacentList [vertex]. begin(); it ! - adjacentList [ver- 
tex]. end() ; it ++) 
( 
if(isOld[* it] = - false) 
( 
tree. push_ back (Edge (vertex, * it, 1)); 
searchDepthFirst (* it, adjacentList, isOld, nVertex, tree); 
} 
} 
} 
void testSearchDepthFirst () 
{ 


vector « Edge > dfTree; 
vector < int > adjacentList [6]; 
adjacentList [0]. push, | back(0) ; 
adjacentList [0]. push_ back (1) ; 
adjacentList [0]. push_ back (2) ; 
adjacentList [0]. push_ back (3); 
adjacentList [0]. push | back (4) ; 
adjacentList [0]. push, | back (5) ; 
adjacentList [1]. push | back (0) ; 
adjacentList [1]. push | back (2) ; 
adjacentList [1]. push | back (3) ; 
adjacentList [2]. push, | back (0) ; 
adjacentList [2]. push. back(1); 
adjacentList [3 }. push_ back (0) ; 
adjacentList [3]. push_ back (1); 
adjacentList [4]. push_ back(0) ; 
adjacentList [4]. push_ back (5); 
adjacentList [5]. push_ back (0) ; 
adjacentList [5]. push_ back (4) : 
bool isOld [6]; 
for(inti-0; i«6; i++) 
( 

isOld[i] = false; 
) 
searchDepthFirst (0, adjacentList, isOld, 6, dfTree); 
for (vector «Edge» :: iterator it -dfTree begin(); it ! -dfTree end(); it ++) 
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{ 
cout << "(" << ít ->start << "*," << it -> end «« ") : " << it ->weight << endl; 
} 
} 
int main () 
{ 
testSearchDepthFirst (); 
system ("pause"); 
return 0; 
} 
A.23 包含 计算 LOW 值 的 深度 优先 搜索 
#include < iostream > 
#include « vector > 
using namespace std; 
struct Edge 
{ 
int start; 
int end; 
float weight; 
Edge (int _ start, int _ end, float _ weight) 
{ 
start =_ start; 
end =_ end; 
weight =_ weight; 
} 
bool operator < (const Edge & e) const 
{ 
return this ->weight <e. weight; 
} 
bool operator > (const Edge & e) const 
{ 
return this -» weight >e. weight; 
) 
bool operator > = (const Edge & e) const 
{ 
return this -» weight > =e. weight; 
} 
bool operator < = (const Edge & e) const 
{ 
return this -» weight < =e weight; 
} 
bool operator = = (const Edge & e) const 
{ 
return (this ->weight = =e weight && 
this -> start = =e start && 
this -> end = =e end); 
} 
) 
// Fig. 5.11 Depth -first search with LOW computation. 
// 深度 优先 遍历 求 图 的 关节 点 的 递归 部 分 ， 只 被 函数 searchDepthFirstLow() WIRE 
// 不 被 单独 调用 
void searchDepthFirstLowPrivate (int * dfnumber, int vertex, vector < int > * adjacentList, 


int * low, int * father, 


bool * isOld, int nVertex, vector «int >& articulationPoints, vector < 


Edge » & tree) 


( 


// 检查 输入 参数 是 否 有 误 
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if (dfnumber = =NULL | 
adjacentList = - NULL || 
low = =NULL || 
isOld = =NULL || 
nVertex <0) 
{ 
return; 
} 
static int count =0; 
int sonnum =0; 
isOld[vertex] =true; 
dfnumber [vertex] = count; 
count ++; 
low[vertex] = dfnumber [vertex]; 
for (vector «int > :: iterator it = adjacentList [vertex]. begin(); 


it ! =adjacentList [vertex]. end(); 
it ++) 

{ 
if(isOld[* it] = = false) 


{ 

tree. push, back (Edge (vertex, * it, 1)); 

sonnum ++ ; 

father[* it] =vertex; 

searchDepthFirstLowPrivate(dfnumber, * it, adjacentList, low, father, isOld, nVe- 
rtex, articulationPoints, tree); 

if (father [vertex] ! = -1 && low[* it] > -dfnumber[vertex]) // 不 是 根 顶点 

( 


articulationPoints. push_ back (vertex); 


H 

low[vertex] =min(low[vertex], low[* it]); 
) 
else if(* it ! -father[vertex]) 
( 


low[vertex] -min(low[vertex], dfnumber[* it]); 
) 
) 


if (father [vertex] = = -1 && sonnum>1) // RMA, E son 的 个 数 不 只 1 个 
{ 
articulationPoints. push | back (vertex); 
) 
) 
// 通 过 图 的 深度 优先 遍历 来 找 图 的 关节 点 
// 用 关节 点 来 分 隔 各 个 连通 分 支 
// 输 入 : 


// vertex: ”图 中 开始 搜索 的 顶点 

// adjacentList: 数组 ， 存 放 所 有 顶点 的 邻接 点 列表 

// adjacentList [i] RBA i 的 所 有 邻接 点 的 列表 

// nVextex: 图 中 顶点 的 数目 ， 顶 点 编号 从 0 到 (vertex -1); 
// tree: ”深度 优先 生成 树 的 边 集 

// 输 出 : 

l dfnumber: 图 中 的 顶点 在 深度 搜索 中 被 遍历 到 的 顺序 序号 

// articulationPoints: 图 中 的 关节 点 的 列表 


/ /测试 函数 ; 

// void testSearchDepthFirstLow(); 
// 测 试 数据 ， 

// ”遍历 的 起 点 是 v0 

// 原 图 为 如 下 : 

// (v3) 

// | \ 


// 1 \ 3 
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// | \ 

// (v4) - - (v0) - - (v1) 
// | / \ | 
// i os NI 
// 1 / \ 1 
// (v5) (v2) 
// 

/ /测试 结果 : 

// ”生成 的 深度 优先 遍历 树 : ( 树 的 根 是 v0) 
// (v3) 

// \ 

// \ 

// \ 

// (v4) - - (v0) - - (v1) 
// | | 

// | | 

// | | 

// (v5) (v2) 
// 得 到 的 关节 点 是 v0 

// 第 二 组 测试 数据 : 

// 遍历 的 起 点 是 vo 

// v0 

// / \ 

// / \ 

// vVl------ v2 
// / \ 

// / \ 

// v3--- -v4 

Hl / 

// / 

// v5b----- v8 

// DON | 

// | \ l 

// | Vd 

// v6----- v7 

// 第 二 组 测试 结果 : 

// 生成 的 深度 遍历 树 为 : 

// v0 

// / 

// / 

// vl------ v2 
// / 

// / 

// v3 - - - -vå 

// / 

// / 

// v5 v8 

// l | 

// | | 

// 1 | 

// v6----- v7 

// ”得 到 的 关节 点 为 ; vl, v3, v5 


void searchDepthFirstLow(int * dfnumber, int vertex, vector <int >* adjacentList, int nVer- 


vector «int >& articulationPoints, vector < Edge » & tree) 


int * low =new int [nVertex]; 

int * father -new int[nVertex]; 
bool * isOld -new bool [nVertex]; 
for(int i=0 ; i«nVertex; i ++) 
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{ 
low[i]- -1; 
father {iJ = -1; 
dfnumber [i] = -1; 
isOld[i] = false; 
) 


tree. clear (); 
searchDepthFirstLowPrivate (dfnumber, vertex, adjacentList, low, father, isOld, nVertex, 
articulationPoints, tree); 
if(low ! sNULL) 
( 
delete [] low; 
) 
if(father ! -NULL) 
{ 
delete [] father; 
} 
if(isOld ! =NULL) 
{ 
delete [] isOld; 
} 
} 
void testSearchDepthFirst Low () 
{ 
// 第 一 组 测试 数据 初始 化 
vector « Edge > dfTree; 
//vector «int »adjacentList [6] ; 
//adjacentList [0]. push_ back (0) ; 
//adjacentList [0]. push_ back (1) ; 
//adjacentList [0]. push_ back (2) ; 
//adjacentList [0]. push_ back (3) ; 
//adjacentList (0). push_ back (4) ; 
//adjacentList [0]. push_ back(5) ; 
//adjacentList [1]. push_ back (0) ; 
//adjacentList [1]. push_ back (2) ; 
//adjacentList (1). push_ back (3); 
//adjacentList [2]. push_ back (0) ; 
//adjacentList [2]. push_ back (1) ; 
//adjacentList [3]. push_ back (0) ; 
//adjacentList [3]. push, back(1); 
//adjacentList [4]. push_ back (0) ; 
//adjacentList (4). push | back(5) ; 
//adjacentList [5]. push back (0) ; 
//adjacentList [5]. push, , back (4); 
//int dfnumber [6]; 
// 测试 数据 第 二 组 
vector < int » adjacentList [9]; 
adjacentList [0]. resize (2); 
adjacentList [0]. at (0) x1; 
adjacentList [0]. at (1) 22; 
adjacentList [1]. resize (4); 
adjacentList [1]. at (0) 20; 
adjacentList [1]. at (1) 22; 
adjacentList [1]. at (2) «3; 
adjacentList [1]. at (3) 24; 
adjacentList [2]. resize (2); 
adjacentList [2]. at (0) =0; 
adjacentList [2]. at (1) =1; 
adjacentList [3]. resize(3); 
adjacentList [3]. at (0) =1; 
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测试 


adjacentList [3]. at (1) 24; 
adjacentList [3]. at (2) 25; 
adjacentList [4]. resize (2); 
adjacentList [4]. at (0) =1; 
adjacentList [4]. at (1) 3; 
adjacentList [5]. resize(4); 
adjacentList [5]. at (0) 2-3; 
adjacentList [5). at (1) =6; 
adjacentList [5]. at (2) 27; 
adjacentList [5]. at (3) 2-8; 
adjacentList [6]. resize(2); 
adjacentList [6]. at (0) =5; 
adjacentList [6]. at (1) 27; 
adjacentList [7]. resize (3); 
adjacentList [7]. at (0) 25; 
adjacentList [7]. at (1) - 6; 
adjacentList [7]. at (2) 28; 
adjacentList [8]. resize (2); 
adjacentList [8]. at (0) 25; 
adjacentList [8]. at (1) =7; 
int dfnumber [9]; 

vector «int »articulationPoints; 
articulationPoints. clear(); 


// 开始 测试 
//searchDepthFirstLow(dfnumber, 0, adjacentList, 6, articulationPoints, dfTree); // 第 一 组 


searchDepthFirstLow(dfnumber, 0, adjacentList, 9, articulationPoints, dfTree); // 第 二 组 测 


// 输出 测试 结果 
for (vector «Edge > :: iterator it =dfTree begin(); it ! -dfTree end(); it ++) 
( 
cout << " (* << it ->start <<"," «cit -» end <<"): * << it -» weight << endl; 
) 
cout << "X PAA; * «cendi; 
for(vector < int »:: iterator it = articulationPoints. begin (); it ! = articulation- 


Points. end(); it ++) 


( 


cout << * it << ’\t’; 


) 
cout «« endl; 
} 
int main() 
{ 
test SearchDepthFirstLow(); 
system ("pause"); 
return 0; 
} 


A 24 计算 有 向 图 强 连通 分 支 的 算法 


#include < iostream > 

#include < vector > 

using namespace std; 

bool isinStack (int elem, const vector «int >& stack) 


{ 


for (vector <int >:: const iterator it = stack begin(); it ! =stack end(); it ++) 
{ 


if(elem= =* it) ( 
return true; 
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} 
return false; 
} 
// Fig 5.15 Procedure to compute LOWLINK. 
// 深度 优先 遍历 计算 有 向 图 强 连通 分 支 
// WA: 
// vertex; 深度 优先 遍历 起 始点 
// isold: ”记录 各 点 被 访问 的 情况 。isola [i] 为 true 表示 点 i 已 经 被 访问 过 了 ， 
H isOld[i] 4 false RAR i 尚未 被 访问 过 
// adjacentList: 记录 各 点 的 邻接 点 链表 
// adjacentList [i] 表 示 从 点 i 链接 到 的 点 所 组 成 的 链表 
// nVertex; 图 中 所 有 点 的 个 数 
// 
// 输出 : 
// dfnumber: 深度 优先 遍历 中 点 被 遍历 顺序 序列 
// dfnumber [i RRA i 在 深度 优先 遍历 中 被 遍历 的 次 序 


// lowLink: lowlink[i] 表示 点 i 在 以 点 lowLink[i] 为 代表 的 连通 分 支 内 
// 


// 测试 数据 : 

// 原 输入 有 向 图 如 下 : 

// AM: (0,1,2,3,4,5,6,7); 
/4 WM: «0,12 «0,32 <0, 4> 


// <1,2><1,3> 

// «2,0» 

// «3,2» 

// «4,3» 

// <5,6><5,7> 

// «6,4» 

// <7,3><7,5><7,6> 
// 测试 结果 : 


// 生成 的 强 连通 分 支 (0, 1, 2) (3)(4)(5, 7) (6) 
void searchDepthFirstLowLink( int vertex, int * dfnumber, int * lowLink, bool * isOld, vector 
«int»* adjacentList, 
int nVertex, vector < int » & vertexStack) 
{ 
static int count; 
isOld[vertex] = true; 
dfnumber [vertex] = count; 
count ++; 
lowLink [vertex] = dfnumber [vertex]; 
vertexStack push, back (vertex) ; 
// 对 于 这 个 点 的 所 有 的 邻接 点 : 
for (vector «int >:: iterator it =adjacentList [vertex]. begin(); 
it ! zadjacentList[vertex]. end(); 
it ++) 


if(isOld[* it] = -false) // * it 这 个 点 是 新 的 ， 尚 未 被 遍历 到 
( 
searchDepthFirstLowLink(* it, dfnumber, lowLink, isOld, adjacentList, nVertex, 
vertexStack); 
lowLink [vertex] =min(lowLink[vertex], lowLink[* it]); 
} 
else if (dfnumber[* it] <dfnumber [vertex] && 
isInStack(* it, vertexStack) ) 
{ // 这 个 点 已 经 被 遍历 过 了 
lowLink [vertex] =min(dfnumber[* it], lowLink[vertex]); 
} 
) // end for - loop 
if (lowLink [vertex] = =dfnumber [vertex] } 
{ 
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int x= -1; 

do 

{ 
x =vertexStack back(); 
vertexStack pop back(); 
cout << x << endl; 

}while(x ! =vertex); 


cout << "以 上 各 点 在 同一 下 强 连 通 分 支 !" << endl; 


} 
void testSearchDepthFirstLowLink () 
{ 
const int NVERTEX =8; 
int dfnumber [NVERTEX] ; 
int lowlink [NVERTEX] ; 
bool isold[NVERTEX]; 
vector «int > adjacentlist [NVERTEX]; 
vector «int » vertexstack; 
// 初始 化 变量 
for(int i =0; i«NVERTEX; i ++) 
{ 
isold[i] = false; 
lowlink[i] =NVERTEX; 


} 
// 建 有 向 图 
adjacentlist [0]. push,, back (1) ; 
adjacentlist [0]. push_ back (3); 
adjacentlist [0]. push. back (4) ; 
adjacentlist[1]. push, back (2); 
adjacentlist [1]. push | back (3) ; 
adjacentlist [2]. push_ back (0) ; 
adjacentlist [4]. push, | back (3); 
adjacent list [5]. push_ back (6) ; 
adjacentlist [5]. push_ back (7); 
adjacent list [6]. push, , back (4) : 
adjacentiist [7]. push_ back (3); 
adjacentlist [7]. push |. back (5); 
adjacentlist [7]. push, back(6); 
// 在 有 向 图 中 找 生成 树 ， 并 找到 强 连通 分 支 
for(int i =0; i«NVERTEX; i ++) 
{ 
if(! isold[i]) // 找 个 点 尚未 被 遍历 到 
{ 
searchDepthFirstLowLink( i, dfnumber, lowlink, isold, adjacentlist, 
NVERTEX, vertexstack); 
) 
) 
// 打印 出 10wlink 结果 
for(int i=0; i«NVERTEX; i e) 
( 
cout << "dfnumber[" ««i««"] =" «« d£number[i] <<" Vt"; 
cout << "lowlink[" <<i ««"] =" << lowlink[i] << endl; 


int main() 


testSearchDepthFirstLowLink(); 
system("pause"); 
return 0; 
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A 25 Dijkstra 算法 


#include < iostream > 
using namespace std; 


// fig 5.24 Dijkstra's algorithm(shortest path). 
// Dijkstra 计算 从 一 点 到 多 点 的 最 短路 径 

// MA: 

A/ startvertex: 作为 起 点 得 点 

H nVertex: 有 向 图 的 点 数 

// weightTable: 有 向 图 及 其 边 权 重 的 存放 和 矩阵 
// weightTable[i * nVertex +j] 为 从 点 i 到 点 j 的 边 的 权重 ， 
// 如 果 有 向 图 中 不 存在 该 边 ， 则 为 一 个 最 大 数 

// 输出 : 

H dist; 从 起 点 到 各 点 的 最 短路 径 的 长 度 

// dist [i] RM startvertex 到 点 i 的 最 短路 径 的 长 度 
// 测试 函数 : 

// void testDijkstraShortestPath() 

// 测试 数据 : 

/7/ (2) 

// 0---»1 

/1/ i / 13) 

//^ 00)! /(7) 1 

// TAE \/ 

// 4- - ->2 

// /N(6) / 

// | / (4) 

// (5) | / 

// | 1/ 

// 3 

// 测试 结果 : 

// 0 ->1 最 短路 径 长 2 

// 0 ->2 最 短路 径 长 5 

// 0 ->3 最 短路 径 长 9 

// 0 ->4 最 短路 径 长 9 


( 


if (startvertex > -nVertex) 


{ 


} 


cout << "Error: the start vertex is out of range. * << endl; 


return -1; 


bool * isVisited =new bool[nVertex]; 


// 临时 数组 的 初始 化 


for(int i=0; i«nVertex; i ++) 


{ 


} 


// dist [i] 中 记录 从 startvertex 到 i 的 边 的 权重 
dist [i] =weightTable [nVertex * startvertex +i]; 
isVisited[i] = false; 


isVisited[startvertex] -true; 
bool allVisited - false; 
while(! allVisited) 


( 


int minVertex = -1; 
int minWeight = SHRT_ MAX; 
for(int i =0; i«nVertex; i++) 


{ 


if (isVisited[i] = =false) // 点 i 不 在 S 中 , 在 V-s 中 。 


{ 
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int dijkstraShortestPath(int startvertex, int nVertex, int * weightTable, int * dist) 


ee 
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i]: 


) 


if (dist (i] <minWeight) 
{ 
minVertex =i; 
minWeight =dist [i]; 


} 
} 
if (minVertex = = -1) 
{ 
break; 
} 


isVisited[minVertex] -true; 
allVisited -true; 
for(int i=0; i«nVertex; i++) 


{ 
if (isVisited(i] = =false) // 点 i 在 V-Ss 中 
{ 
dist [i] = min (dist [i], dist [minVertex] + weightTable [nVertex * minVertex + 
allvisited = false; 
} 
} 
} 
/ PCS BB S [8] 


if(isVisited ! - NULL) 

{ 
delete [] isVisited; 
isVisited - NULL; 

} 

return 0; 


void testDijkstraShortest Path ()} 


{ 


const int NVERTEX =5; 

int weight Tabie (NVERTEX * NVERTEX] ; 

// 初始 化 带 权 有 向 贸 

weightTable[0 * NVERTEX +0j =0; 
weightTable[0 * NVERTEX +1] -2; 
weightTable[0 * NVERTEX +2] =SHRT_ MAX; 
weightTable[0 * NVERTEX +3] =SHRT_ MAX; 
weightTable[0 * NVERTEX +4] =10; 
weightTable[1 * NVERTEX +0] -SHRT | MAX; 
weightTable[1 * NVERTEX «1] =0; 
weightTable[1 * NVERTEX +2] =3; 
weightTable(1 * NVERTEX +3] = SHRT_ MAX; 


weightTabie[1 * NVERTEX +4] =7; 
weightTable[2 * NVERTEX +0] = SHRT_ MAX; 
weightTable[2 * NVERTEX +1] = SHRT MAX; 
weightTable(2 * NVERTEX +2] =0; 
weightTable[2 * NVERTEX +3] =47 
weightTable(2 * NVERTEX +4] = SHRT_ MAX; 
weightTable[3 * NVERTEX +0] = SHRT_ MAX; 
weightTable[3 * NVERTEX +1] = SHRT_ MAX; 
weightTable[3 * NVERTEX +2] =SHRT_ MAX; 
weightTable[3 * NVERTEX +3] =0; 
weightTable[3 * NVERTEX +4] 25; 
weightTable[{4 * NVERTEX +0] = SHRT | MAX; 
* 


weightTable [4 NVERTEX +1] = SHRT_ MAX; 
weightTable[4 * NVERTEX +2] =6; 
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weightTable[4 * NVERTEX +3] = SHRT_ MAX; 

weightTable[4 * NVERTEX «4] -0; 

int dist [NVERTEX] ; 

dijkstraShortestPath(0, NVERTEX, (int * )weightTable, dist); 
// 显示 出 从 0 到 各 个 点 的 最 短 距离 

for (int i =0; i«NVERTEX; i ++) 

{ 


cout << "from 0 to " ««i««* : "<<dist[i] <<endl; 


) 
) 
int main() 
{ 
testDijkstraShortestPath (); 
system ("pause"); 
return 0; 
} 


A.26 JERR) LUP 分 解 算法 


finclude < iostream > 

#include «string» 

#include < assert. h > 

using namespace std; 

和 
矩阵 类 ， 

| 


Class Matrix 


{ 
public: 
Matrix(int row, int col) 
{ ， 
int i=0; 


this ->m_ ppData = NULL; 
this ->m_ iRowz0; 
this ->m_ iCol =0; 
if (row< =0 | col < =0) 
{ 
return; 
} 
this ->m_ iRow = row; 
this ->m_ iCol =col; 
this ->m_ ppData = new double* [row]; 
for(i =0; i<row; i++) 
{ 
this ->m_ ppData[i] =new double[col]; 
memset (this ->m_ ppData[i], 0, sizeof (double) * this-»m  iCol); 


} 
} 
Matrix(const Matrix& other) 
( 
this -> operator = (other); 
} 
-Matrix() 
{ 
ClearMemory (); 
} 


double* operator [] (int rowIndex) 
{ 
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double* pData - NULL; 
if (rowIndex > -0 && rowIndex «this ->m_ iRow) 
( 
if(this ->m_ ppData ! zNULL) 
{ 
pData = this ->m_ ppData [rowIndex] ; 


} 
return pData; 
} 
Matrix& operator = (const Matrix& other) 
{ 
if (&other = =this) 
{ 
return * this; 
} 
int i-0; 
this ->m_ iCol =other. m_ iCol; 
this ->m_ iRow = other. m_ iRow; 
this ->m_ ppData =new double* [this ->m_ iRow]; 
for(i-0;i«this-»m iRow; i ++) 
{ 
this ->m_ ppData[i] = new double(this ->m_ iCol]; 


memcpy (this ->m_ ppData [i], other.m_ ppData [i], sizeof (double) * this ->m_ 
icol); 


} 
return * this; 
} 
Matrix operator + (const Matrix& other) 
{ 
int i=0; 
int j =0; 
if (this ->m_iCol ! -other.m iCol | this -»m, iRow! =other.m_ iRow) 
{ 


return * this; 
} 
Matrix result (this ->m_ iRow, this ->m_ iCol); 
for(i=0; i<this ->m_ iRow; i ++) 
{ 
for (j =0; j«this ->m_ iCol; j++) 
{ 


result [i] [j] = (* this) [i] [3] +const_ cast «Matrix & > (other) [i] [ji 


) 
return result; 
) 


Matrix operator - (const Matrix& other) 
{ 


int i=0; 

int j =0; 

Matrix result (this ->m_ iRow, this ->m_ iCol); 

if (this m icol ! =other.m_iCol f this ->m_ iRow ! -other.m iRow) 


( 
return(* this); 
) 
for(i=0; i«this-»m iRow; i++) 
( 


for(jz0; j«this-»m icol; j++) 
{ 
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result[i][j]- (* this)[i][j] -const_ cast «Matrix & > (other)(i][j]: 


) 
return result; 
) 
friend ostream& operator «« (ostream& o, const Matrixk a) 
( . 
if(a m. ppData ! =NULL) 


{ 
for(int i=0; i<am_ iRow; i++) 
{ 
for(int j =0; j<am iCol; j ++) 
{ 
o <<a m_ ppData [il] (j]; 
o<<" "; 
} 
o << endl; 
} 
} 
return 0; 


} 
Matrix operator * (const Matrix& other) 
{ 
int i=0; 
int j =0; 
int k=0; 
Matrix result (this ->m_ iRow, other. m_ iCol); 
if (this ->m_ iCol ! -other.m iRow) 
{ 
return result; 
} 
for(i =0; i<result.m_ iRow; i++) 
{ 
for (j =0; j<result.m_ iCol; j ++) 
{ 
for (k =0; k<this ->m_ iCol; k ++) 
{ 
result [i] [j] =result{i] [j]+ 
(* this) [i] (k] * const. cast «Matrix & > (other) [k] [j]; 


} 

return result; 
} 
void InterChangeColumn (int coll, int col2) 
{ 

if (coll <0 && coll > =this ->m_ iCol) 


{ 
return; 
} 
if (col2 <0 && col2 > =this ->m_ iCol) 
{ 
return; 
} 
for(int i=0; i«this-»m iRow; i ++) 
{ 


double temp = (* this) [i] [coll]; 
(* this) [i) [coll] = (* this) [i] [col2]; 
(* this) [i] [col2] =temp; 
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) 
void InitializeAsPermutationMatrix() 
( 
if (this ->m_ iCol ! =this ->m_ iRow) 
{ 
return; 
} 
for(int i=0; i<this ~>m_ iRow; i ++) 
{ 
(* this) (i) [i] =1; 
} 
} 
int GetRowCount () ( return m_ iRow;} 
int GetColumnCount () { return m_ iCol;} 
private: 
void ClearMemory () 
{ 
int i=0; 
if (this -^m, ppData ! =NULL) 
{ 
for(i=0; i<this ->m_ iRow; i++) 
{ 
delete [] (this ->m_ ppData[i]); 
this ->m_ ppData[i] = NULL; 
} 
delete []this ->m_ ppData; 
this ->m_ ppData = NULL; 


} 
private: 
double* * m ppData; 
intm, iRow; 
intm, iCol; 
) 
Matrix GetUpperTriangularInverse (Matrix& a); 
// LUP 和 矩阵 分 解 算法 
// HR: 将 一 n x mn 和 矩阵 分 解 为 单位 下 三 角 和 矩阵 ， 上 三 角 和 矩阵 和 组 合 卸 阵 的 乘积 
// | WS: void FACTOR(Matrix& A, int m, int p, Matrix* & L, Matrix* & U, Matrix* & P) 
// MA: 


/7/ Matrix& A: 和 矩阵 和 

// int m: JEPE a 的 行 数 

// intp: JER ahak 

// 输出 : 

// Matrix* & L: 分 解 出 的 单位 下 三 角 和 矩阵 
// Matrix* &U: 分 解 出 的 上 三 角 矩 阵 
// Matrix* & P: 分 解 出 的 组 合 矩 阵 
// WR: Test FACTOR () 

// 输入 : 

// A: 0 0 0 1 

// 0 0 2 0 

// 0 3 0 0 

// 4 0 0 0 

// 

// m: 4 

// p: 4 

// ”输出 : 

// L: 1 0 0 0 

// 0 1 0 0 

// 0 0 1 0 

"7 0 0 0 1 
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// 

/7/ U: 1 0 0 0 
// 0 2 0 0 
// 0 0 3 0 
// 0 0 0 4 
// 

// P: 0 0 0 1 
// 0 0 1 0 
// 0 1 0 0 
// 1 0 0 0 


void FACTOR (Matrix& A, int m, int p, Matrix* & L, Matrix* & U, Matrix* & P) 
{ 
if(ms =1) 
{ 
L=new Matrix(1, 1); 
(* L) [01 (0] 21; 


// Yt P PPR AE 

P =new Matrix(p, p): 

P -»InitializeAsPermutationMatrix(); 
// 找到 A 的 有 非 0 元素 的 第 Cc 行 

int iARow =A GetRowCount () ; 

int iACol - A GetColumnCount (); 

int c=0; 

bool found = false; 

for(c =0; c«iACol; c++) 

{ 


for (int r=0; r«iARow; r ++) 
{ 
if(A[r]{c] ! =0) 
{ 
found = true; : 
break; 
} . 
} 
if (found) 
{ 
break; 
} 
} 
if (found) 
{ 
P -» InterChangeColumn (0, c); 
} 


U = new Matrix (iARow, iACol); 
* UzA * (* P); 
return; 

} 

else 

{ 


Matrix B(m/ 2, p); 
Matrix C(m/ 2, p); 
int i=0; 
int j =0; 
for(i=0; i<m/2; i++) 
{ 

for(j=0; j«p: j++) 
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( 
B(illj] -A[i](3]: 
) 
) 
for(;i«m; i++) 
{ 
for (j=0; j<p; j++) 
{ 
C[(í-m/21[j] =Alil (jl; 
} 
} 


Matrix* Ll =NULL; 
Matrix* Ul =NULL; 
Matrix* Pl =NULL; 
FACTOR(B, m / 2, p, Li, Ul, Pl); 


MatrixDsC* (* P1); // P=P fit 
Matrix E(m/2, m/2); 


Matrix F(m/2, m/2); 
for(i =0; i<m/2; i++) 


{ 
for(j=0; j <m/2; j++) 
{ 
E[{i] [j] =(* U1)(iltjl: 
} 
} 
for(i =0; i<m/2; i++) 
{ 
for(j=0; j <m/2; j++) 
{ 
F(illjl =D[i} fj); 
} 
} 


Matrix EInverse (m /2, m /2); 

// 计算 了 的 道 矩 阵 

// 因为 pl 是 上 3 角 和 矩阵 ， 可 用 特殊 方法 求 它 的 逆 
EInverse = GetUpperTriangularInverse (E); 
Matrix G-D-F * EInverse * (* U1); 


Matrix Gother (m / 2, p-m /2) ; 
for(i=0; i<m/2; i++) 


{ 
for(j=0; j<p-m/2; j++) 
{ . 
Gother [iJ [j] »Glil[j +m /2); 
) 
} 


Matrix * L2 = NULL; 
Matrix* U2 -NULL; 
Matrix* P2 -NULL; 
FACTOR(Gother, m /2,p-m/2, L2, U2, P2); 


Matrix P3 (p, p); 
for(is0; i«m/2; i ++) 
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( 
P3[i] [i] =1; 
} 
for (i =m /2; i <p; i++) 
{ 
for (j =m /2; j <p; j++) 
{ 
P3 {i} {j]=(* P2) là -m /21(3 - m /21; 
) 
) 


Matrix H=(* U1) * (P3); 
L =new Matrix(m, m); 
for(i =0; i<m/2; i++) 


{ 
for(jz0;j«m/2; j++) 
{ 
(* L) {il (5) = (* L1) (il (i); 
} 
} 


Matrix temp =F * EInverse; 
for(iem/2; i<m; i++) 


for(j=0; j<m/2; j++) 
(* L) [i] (j] =temp[i -m/2][j}; 
) ) 
for(i-m/2;i«m; i++) 
i for(j=m/2; j«m; j++) 
(* L) [31[3] = (* L2) (i - m/2] [j -m/2); 
) } 


U =new Matrix(m, p); 
for(iz0;i <m/2; i++) 


{ 
for (j=0; j <p; j++) 
{ 
(* U) (i) (5) = HOG) (51: 
} 
} 


for(i-m/2;i«m; i++) 


{ 
for(j=m/2;j<p:j+) 
{ 
(* U) CA) CG] = (* U2) [i -m/2](j - m/21; 
} 
} 


P =new Matrix(p, p): 
(* P) zP3 * (* P1); 
delete L1; 

delete Ul; 

delete Pl; 

delete 12; 

delete U2; 
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delete P2; 
} 
} 


[eee RR RR Rk hk RR ek ka ak ee eR a ee 


RE = Ae 
ee fh 
Matrix GetUpperTriangularInverse (Matrix& a) 
{ 

int r =a GetRowCount () ; 
int c =a. GetColumnCount () ; 
assert (r = =c); 
Matrix res(r, C); 
for(int i=0; i<r; i++) 
{ 
res[i] [i] 21.0 / afi] (i); 
} 
for(int i =0; i<r; i++) 
{ 
for(int j =0; j<c; j ++) 
{ 
if(i«j) 
{ 
double t =0; 
for(int k=i; k«j-1; k++) 
{ 
t+ =a[j]{k] * res{k] [i]: 
} 
res[i][j}= -1* (1.0 /alij{i] ) * t; 


) 
return res; 
} 
// 
// 打印 输出 矩阵 
// 
void PrintMatrix (string name, Matrix& m) 


cout << endi; 
cout <<m; 
} 
void Test FACTOR () 
{ 
Matrix a(4, 4); 
a[01[3] 21; 
a[11[2] 22; 
a[2] [1] 23; 
a[31(0] 24; 
Matrix * L -NULL; 
Matrix* U=NULL; 
Matrix* P -NULL; 
FACTOR (a, 4, 4, L, U, P); 
PrintMatrix("L", * L); 
PrintMatrix("U", * U); 
PrintMatrix("P", * P); 
} 
int main(int argc, char* argv[]) 
{ 
TestFACTOR () ; 
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system ("pause"); 
return 0; 
} 


A.27 Four Russians ARERR 


#include < iostream > 

#include < string > 

#include «math h > 

#include < assert. h > 

using namespace std; 

// | FourRussians 布尔 矩阵 乘法 

// HR: 求 两 个 N* ON AERO 

// MM: void FourRussiansBooleanMatrixMultipulation (Matrix& A, Matrix& B, Matrix& C) 
// WA: 


li Matrix& A: 和 矩阵 和 

// Matrix& B: 和 矩阵 3B 

// 输出 : 

HH Matrix& C: 矩阵 C 

// MEAK: TestFourRussian() 

// ”测试 数据 : 

I/ A----- 

H 

// 0 0 1 0 0 0 0 0 
// 1 0 1 0 0 0 0 0 
Mf 1 1 1 0 0 0 0 0 
// 1 0 0 0 0 0 0 0 
// 0 0 0 0 0 0 0 0 
// 1 1 0 0 0 0 0 0 
// 0 0 0 0 0 0 0 0 
// 0 1 1 0 0 0 0 0 
1/ sannan B----------+----- 

H 

// 0 1 0 1 1 0 0 1 
// 0 0 0 1 0 1 0 0 
" 1 1 0 1 0 0 0 0 
/1 0 0 0 0 0 0 0 0 
// 0 0 0 0 0 0 0 0 
tt 0 0 0 0 0 0 0 0 
// 0 0 0 0 0 0 0 0 
H 0 0 0 0 0 0 0 0 
// ”测试 函数 : - 

7 aana C-------------- 

// 

// 1 1 0 1 0 0 0 0 
HH 1 1 0 1 1 0 0 1 
/1 1 1 0 1 1 1 0 1 
H 0 1 0 1 1 0 0 1 
// 0 0 0 0 0 0 0 0 
H 0 1 0 1 1 1 0 1 
// 0 0 0 0 0 0 0 0 
// 1 1 0 1 0 1 0 0 
// 

// 

// “计算 以 2 HER log 

// 


double log2 (double a) 
( 
return logí(a) / 1og(2.0); 
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矩阵 类 ; 
封装 一 部 分 矩阵 基本 操作 > 
RM MEER EEEEsslsssssl62;csssxsssssssscscc 
class Matrix 
{ 
public: 
Matrix(int row, int col) 
{ 
int i=0; 
this ->m_ ppData = NULL; 
this ->m_ iRow =0; 
this ->m_ iCol =0; 
if(row« =0 || col < =0) 
{ 
return; 
} 
this ->m_ iRow = row; 
this ->m_ iCol =col; 
this ->m ppData = new double* [row]; 
for(i =0; i<row; i++) 
{ 
this ->m_ ppData[íi) =new double[col]; 
memset (this ->m_ ppData[i], 0, sizeof (double) * this ->m iCol); 
} 
} 
Matrix (const Matrix& other) 
{ 
this -> operator = (other); 
} 
-Matrix() 
( 
ClearMemory (); 
) 
double* operator [] (int rowIndex) 
( 
double* pData - NULL; 
if (rowIndex > -0 && rowIndex «this m iRow) 
( 
if (this ->m_ ppData ! - NULL) 
{ 
pData = this ->m_ ppData [rowIndex) ; 
} 
} 
return pData; 
} 
Matrix& operator = (const Matrix& other) 
{ 
if (&other = =this) 
{ 
return * this; 
} 
int i=0; 
this ->m_ iCol =other. m_ iCol; 
this -> m, iRow = other. m_ iRow; 
this ->m_ ppData = new double* [this ->m_ iRow]; 
for (i=0; i<this ->m iRow; i ++) 
{ 
this ->m_ppData{i] = new double[this ->m_ iCol]; 
memcpy (this ->m_ ppData[il, other.m_ ppData[i], sizeof (double) * this ->m 








354 





icol); 
} 
return * this; 
} 
Matrix operator + (const Matrix& other) 
{ 
int i=0; 
int j =0; 
if (this ->m_ iCol ! =other.m_iCol | this-»m iRow ! -other.m iRow) 
{ 
return * this; 
} 
Matrix result (this ->m iRow, this ->m iCol); 
for (i=0; i<this ->m_ iRow; i ++) 
{ 
for(j=0; j<this->m_iCol; j++) 
{ 
result (i) [j} = (* this) [i][i] «const. cast «Matrix & > (other) [i][j]: 
} 
} 
return result; 
} 
Matrix operator - (const Matrix& other) 
{ 
int i=0; 
int j =0; 
Matrix result (this ->m_ iRow, this ^m iCol); 
if (this ->m iCol ! -other.m iCol | this-»m iRow! -other.m, iRow) 
{ 
return(* this); 
} 
for(i=0; i<this ->m_ iRow; i ++) 
{ 
for(j=0; j«this-»m iCol; j++) 
{ 
result {i] [j] = (* this) [i] [j] - const | cast «Matrix & > (other) [i] [j]; 
} 
} 
return result; 
} 
friend ostream& operator << (ostream& o, const Matrixk a) 
{ 
if(am_ppData ! =NULL) 
{ 
for(int i=0; i<am iRow; i++) 
{ 
for(int j =0; j«a. m. iCol; j ++) 
{ 
o«cam ppData[il(jl: 
O««" Wi 
} 
o<<endl; 
) 
) 
return o; 
) 
Matrix operator * (const Matrix& other) 
{ 


int i=0; 
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) 


int j =0; 

int k=0; 

Matrix result (this ->m_ iRow, other. m_ iCol); 
if (this ->m icol ! =other.m_ iRow) 

{ 


return result; 
} 
for(i =0; i<result.m_ iROW; i ++) 


{ 
for (j =0; j«result.m iCol; j ++) 
{ 
for(kz0; k«this -»m, iCol; k++) 
( 
resultí[i](j) »result[(i][j] + 
(* this)([iJ][k] * const, cast «Matrix & > (other) fk] [j]; 
) 
) 
) 


return result; 


void InterChangeColumn (int coil, int col2) 


( 


) 


if (coll <0 && coll > -this ->m_ iCol) 
{ 
return; 
} 
if(col2 <0 && col2 > =this -»m, iCol) 
{ 
return; 
} 
for(int i=0; i<this ->m_ iRow; i ++) 
{ 
double temp = (* this) [i] {col1]; 
(* this) [i] [coll] = (* this) [i] {col2]; 
(* this) [il(col2] =temp; 


void InitializeAsPermutationMatrix() 


{ 


} 


if (this ->m_iCol ! =this ->m_ iRow) 
{ 

return; 
} 
for(int i=0; i«this ->m iRow; i++) 
{ 

(* this) (i) [i] =1; 


int GetRowCount () ( return m, iRow;) 

int GetColumnCount () ( return m_ iCol;) 
private: 

void ClearMemory () 


( 


int i=0; 
if (this ->m_ppData ! = NULL) 
{ 
for(i=0; i<this ->m_ iRow; i ++) 
{ 
delete [] (this ->m_ ppData[il]); 
this ->m_ ppData[i) =NULL; 
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} 
delete []this ->m_ ppData; 
this ->m_ ppData = NULL; 


} 
private: 
double* * m, ppData; 
int m, iRow; 
int m, iCol; 
// 
// 打印 输出 和 矩阵 
// 
void PrintMatrix(string name, Matrix& m) 
( 
cout <<"-----------+-- *<ename<<"--+----++----+-- * <cendl; 
cout << endl; 
cout <<m; 
} 
// 
// 得 到 由 0 和 1 组 成 的 逆转 的 整数 值 
// 例如 NUM({0, 1, 1])=6 


tf 
long NUM (Matrix& a) 
{ 
assert (a GetRowCount () = =1); 
int cols =a. GetColumnCount () ; 
long sum =0; 
for(int i =0; i<cols; i++) 
{ 
sum+ = (long) (a[0] (31) * (long)pow(2.0, i): 
} 
return sum; 
} 
void FourRussiansBooleanMatrixMultipulation (Matrix& A, Matrix& B, Matrixk C) 
{ 


assert (A GetRowCount () = =A GetColumnCount () && B. GetRowCount () = =B. GetColumnCount () && 
A GetRowCount () = =B. GetRowCount ()) : 


int n =A GetRowCount () ; 
int m- (int)log2 ((double)n); 
int numberOfPartition = (int) (n / (double)m «0. 5); 
// BAMBARA 
Matrix* * APartitions =new Matrix* [numberOfPartition]; 
for (int i =0; i«numberOfPartition -1; i++) 
{ 
APartitions[i] = new Matrix(n, m); 
for(int j =0; j <n; j++) 
{ 
for (int k=0; k<m; k++) 
{ 
(* APartitions[i])[j](k] =A{j] (i * m+k]; 


} 
} 
APartitions [numberOfPartition -1] =new Matrix(n, m); 
for(int j =0; j«n; j ++) 
{ 

for(int k=0; k<m; k++) 

{ 

if(k«n-m* (numberOfPartition -1)) 
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{ 
(* APartitions [numberOfPartition -1]) [j] {k] =A[j] ((numberOfPartition -1) * 
m+k}; 
} 
else 
{ 
(* APartitions (numberOfPartition -1]) [j] [k] =0; 
} 


Matrix* * BPartitions =new Matrix* [numberOfPartition]; 
for (int i =0; i«numberOfPartition-1; i++) 


{ 
BPartitions [i] =new Matrix(m, n); 
for(int j =0; j <m; j++) 
{ 
for(int k=0; k<n; k++) 
{ 
(* BPartitions[il)[j) (k] -B[i * m«jl(k]; 
) 
) 
) 


BPartitions [numberOfPartition -1] =new Matrix(m, n); 
for(int j =0; j«m; j ++) 
{ 
for(int k=0; k<n; k++) 
{ 
if((numberOfPartition -1) * m+j<n) 
{ 


(* BPartitions (numberOfPartition -1]) [j] [Kk] =B[(numberOfPartition -1) * m+ 
jlL ki 


) 
else 
{ . 
(* BPartitions[numberOfPartition -1])[j][k] =0; 


} 
Matrix* * CPartitions =new Matrix* [numberOfPartition]; 


for(inti-0; i«numberOfPartition ; i ++) 
( 


Matrix* * ROWSUM =new Matrix* [(iong)pow(2.0, m)] ; 


ROWSUM[0] znew Matrix(1, n); 


for(int j =1; j < (long)pow(2.0, m); j ++) 
{ 
int k=0; 
while (true) 
{ 
long valuel = (long) pow (2.0, k}; 
long value2 = (long) pow(2.0, k +1); 
if (valuel < =j && j <value2) 
{ 
break; 
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) 


ROWSUM[j] = new Matrix(1, n); 
Matrix bRow(1, n); 
for(int index =0; index <n; index e) 
{ 
bRow[0] [index] = (* BPartitions[i]) (k] [index]; 
} 
(* ROWSUM[j]) = (* ROWSUM[j - (long) pow(2. 0, k)]) + bRow; 
for(int index =0; index «n; index ++) 


{ 


(* ROWSUM[j] ) [0] [index] = (* ROWSUM(j]) (0] [index] >0 ?1 : 0; 


CPartitions[i] =new Matrix(n, n); 
for(int j =0; j<n; j ++) 


{ 


} 


Matrix aRow(1, m); 
for (int index =0; index «m; index ++) 
{ 
aRow {0] [index] = (* APartitions[i]) [j] [index]; 
} 
long numA = NUM (aRow) ; 


for(int index -0; index<n; index ++) 
{ 


(* CPartitions[i])[j][index] = (* ROWSUM (numA] ) [0] [index] ; 


} 


for (int index =0; index < (long) pow(2.0, m); index ++) 


{ 


) 


delete ROWSUM[index]; 
ROWSUM [index] = NULL; 


delete ROWSUM; 


for (int index =0; index <numberOfPartition; index ++ ) 


{ 


} 


Matrix temp =C + (* CPartitions [index] ); 
C=C +temp; 


for(int i=0; i<n; i++) 


{ 


for(int jz0; j«n: j ++) 


{ 


Clil(j) =Clil{j]>0?1:0; 


for(int i=0; i«numberOfPartition; i++) 


{ 
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delete APartitions[i]; 
APartitions[i] =NULL; 

) 

delete APartitions; 

for(int i =0; i«numberOfPartition; i ++) 

{ 
delete BPartitions [i]; 
BPartitions[i] - NULL; 

) 

delete BPartitions; 


for(int i=0; i«numberOfPartition; i++) 
{ 
delete CPartitions [i]; 
CPartitions [i] =NULL; 
} 
delete CPartitions; 


} 
void Test FourRussian (} 
{ 
int n=8; 
Matrix A(n, n); 
Matrix B(n, n); 
Matrix C(n, n); 
A[0][2] =1; 
A[1][0] =1; 
Af{1](2} =1; 
A[2] [0] =1; 
A[2] {1] =1; 
A[2] [2] =1; 
A[3] [0] 21; 
A[51(0] 21; 
A[5] [1] 21; 
A[7] [1] =1; 
A[7] [2] =1; 
B[0] [1] =1; 
B[0] [3] 21; 
B[0] [4] =1; 
B[0](7] =1; 
B{1] [3] =1; 
B{1] [5] =1; 
B[2][0] 21; 
B{2] [1] 21; 
B[2] [3] =1; 
FourRussiansBooleanMatrixMultipulation(A, B, C); 
PrintMatrix("A", A); 
PrintMatrix("B", B); 
PrintMatrix("C", C): 
) 


int main() 


TestFourRussian(); 
system("pause"); 
return 0; 


) 


A.28 快速 备 里 叶 变换 算法 


#include < iostream > 
#include < vector > 
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#include < complex > 
using namespace std; 
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[RRR eRe eR eR RRR Re eee he 


表示 为 [0, 1, 2, 3, 4, 5, 6, 7] 


* FFT ` 

* 功能 : 快速 传 里 叶 变 换 的 实 

* MRM: void FFT (vector «COMPLEX >a, vector < COMPLEX > & b) 
* 输入 : ` 

* vector «COMPLEX >a: 用 系数 来 表示 的 多 项 式 

* 输出 : 

* vector«COMPLEX»&b: BJ deRIBM nO SAUR 
* 测试 函数 : TestFFT O 

* 输入 : 

* a: 和 多项式 0 -x42x^2 43x^3 «4x^4 «5x^5 -6x^6 «7x^7, 

* ”输出 


* b: [28, -4-i* 9.65685, -4-i* 4, -4-i* 1.65685, 
-4 «i* 9.65685] 


* 


-4, -4+i* 1.65685, -4+i* 4, 


ee 0k 0 0 ERR a 0k Re eR eR ee / 


typedef vector «unsigned char > Bits; 
typedef complex < double > COMPLEX; 
const double PI =3. 1415926535897931; 
const double HalfPI =PI / 2; 
// 
// ”计算 以 2 为 底 的 log 
// 
double log2 (double a) 
( 
return log(a) / log(2.0); 
) 
// 
// 将 一 个 整数 表示 为 二 进 制 0，1 格式 
// 如 3 表示 为 [1L，1]，6 表示 为 [L，0，0] 
// i 代表 要 表示 为 二 进 制 的 整数 ，k 代表 二 进 制 数组 的 位 数 
// 
Bits ToBinary (unsigned int i, int k) 
{ 
Bits bits; 
do 
{ 
bits. insert (bits. begin(), (i$ 2)); 
i /=2; 
)while(i! =0); 
while(bits.size() ! =k) 
{ 
bits. insert (bits. begin(), 0); 
) 
return bits; 


// 将 一 个 二 进 制 表示 的 数 还 原 成 整数 形式 


unsigned int ToInteger (Bits& bits) 
{ 
unsigned result =0; 
for (unsigned int i =0 ;i«bits.size() ; i++) 
{ 
result -result * 2 «bits[i]; 
} 


return result; 
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// 
// 


假设 整数 j AREER do, dl, a2, a3... dk-1] 


// 那么 本 函数 求 二 进 制 表示 的 [dk -1, dk-2, ...a3, a2, di, do] HA 


// 


unsigned int rev (unsigned int j, unsigned int k) 


t 


) 


Bits bits = ToBinary(j, k); 


for (unsigned i =0; i«k /2; i++) 

{ 
unsigned char temp = bits[i]; 
bits{i] -bits[k-1- i]; 
bits{k-1-i] temp; 

) 

return ToInteger (bits); 


// 用 来 求 -1 的 单位 根 
COMPLEX w(int n, int power) 


( 


) 


power = power $ n; 
double u=2 * PI * power /(double)n; 
// 判断 几 个 特殊 值 
double threshold =0. 0000000001; 
if(abs(u-0) «threshold) 
{ 
return COMPLEX (1, 0); 
} 
else if (abs (u -HalfPI) «threshold) 
{ 
return COMPLEX (0, 1); 
) 
else if (abs {u - PI) « threshold) 
t 
return COMPLEX( -1, 0); 
H 
else if(abs(u -3 * HalfPI) «threshold) 
{ 
return COMPLEX(0, -1); 
} 
else if(abs(u-2 * PI) <threshold) 
{ 
return COMPLEX (1, 0); 
} 
else 
{ 
return COMPLEX (cos (u), sin(u)); 
} 


void FFT (vector «COMPLEX >a, vector < COMPLEX > & b) 


{ 


// a 的 长 度 必须 是 2 个 n 次 方 
int n= (int)a size(); 

int k = (int)log2 (n); 

int lMax-n; 

int mMax =k +1; 

// 因为 1=n #Am=k+1 


4/4 所 以 要 分 配 1 * m 的 空间 


vector < COMPLEX > * * *  pppRPolynomial = new vector < COMPLEX > * * [1Max]; 
for (int index =0; index < IMax; index ++) 
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{ 
pppRPolynomial {index} =new vector < COMPLEX > * fmMax ]; 
for (int mIndex =0; mIndex «mMax; mIndex ++ ) 
{ 
pppRPolynomial [index] [mIndex] = new vector < COMPLEX > (); 
} 
} 
(* pppRPolynomial [0] [k]) =a; 
for(int m=k-1;m>=0;m- -) 
{ 
for(int 1=0; 1<n; l« = (int) (pow(2. 0, m+1))) 
{ 
a= (* pppRPolynomial[1] (m+1]); 
unsigned int s = rev( (unsigned int) (1 /(int)pow(2.0, m)), k); 
pppRPolynomial[1][m] -> resize ({ (unsigned int)pow(2.0, m)); 
for (unsigned int j =0; j< (unsigned int)pow(2. 0, m) ; j++) 
{ 
(* pppRPolynomial[1][m]1) [j] = (a{j] +af{j + (unsigned int) pow(2.0, m)) * w(n, 
8)); 
) 
pppRPolynomial[l + (unsigned int)pow(2.0, m) ] [m] -> resize ( (unsigned int)pow(2.0, 
m)); 


for (unsigned int j =0; j< (unsigned int)pow(2.0, m) ; j ++) 
{ 
(* pppRPolynomial [1 + (unsigned int) pow (2.0, m) ] [m]) [3] = (a(j] *a[j + (un 


signed int)pow(2.0, m)] * w(n, s+n/2)); 


} 


{ 





} 
} 
} 
// 输出 结果 
b. resize(n); 
for(int 1=0; l<n; l+} 


{ 

birev(l, k)] = (* pppRPolynomial [1] [0)) [0]; 
} 
// 释放 内 存 


for(int i =0; i<1Max; i++) 
for(int j =0; j <mMax; j ++) 
if (pppRPolynomial [i] [j] ! =NULL) 
delete pppRPolynomial [i] [j]; 


} 

delete {]pppRPolynomial [i]; 
} 
delete [(]pppRPolynomial; 


void TestFFT () 


int n=8; 
vector «COMPLEX >a; 
vector < COMPLEX > b; 
for(int i=0; i<n; i++) 
{ 
& push_ back (COMPLEX (i, 0)); 
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) 

FFT (a, b); 

cout << "结果 是 ;" << endl; 

for (vector <COMPLEX>:: iterator it =b begin(); 
it ! =bend(); 
it ++) 


cout << it ->real() <<" +i* "««it -> imag() << endl; 
} 
} 
int main () 
{ 
TestFFT(); 
system("pause"); 
return 0; 


) 


A.29 简化 的 傅 里 叶 变换 算法 


#include < iostream > 

#include < vector > 

#tinclude < complex > 

using namespace std; 

// FFT 

// H: ”快速 健 里 叶 变 换 的 实现 


// MM: void FFT (vector «COMPLEX >a, vector < COMPLEX > & b) 


// MA: 

/1 vector < COMPLEX >a: 用 系数 来 表示 的 多 项 式 

// i: 

// vector <COMPLEX>&b: ”复数 表示 的 传 里 叶 变 换 的 结果 
// ”测试 函数 : TestFFT() 

// MA: 


// a: 多 项 式 0+x+2x*2 +3x^3 44x74 +5x^5 46x76 47x^77, 表示 为 [0，1，2，3，4，5，6，7] 
// RH: 


// b: [28, -4-i* 9.65685, -4-i* 4, -4-i* 1.65685, -4, -4+i* 1.65685, ~4+i* 4, 
-4 +i* 9.65685] 
/f 


typedef vector «unsigned char > Bits; 
typedef complex < double > COMPLEX; 
const double PI =3. 1415926535897931; 
const double HalfPI = PI / 2; 
// 
// ”计算 以 2 为 底 的 log 
// 
double log2 (double a) 
{ 
return log(a) / log(2.0); 
} 


// 

// 将 一 个 整数 表示 为 二 进 制 0，1 格式 

// 如 3 表示 为 [1，1]，6 RU, 0, 0] 

if i 代表 要 表示 为 二 进 制 的 整数 ，k 代表 二 进 制 数组 的 位 数 
// 


Bits ToBinary (unsigned int i, int k) 
{ 
Bits bits; 
do 
{ 
bits. insert (bits. begin(), (i$ 2)); 
i/=2; 








364 


)while(i! =0); 
while(bits.size() ! =k) 
( 

bits. insert (bits. begin(), 0); 


) 
return bits; 
) 
Jf 
// 将 一 个 二 进 制 表 示 的 数 还 原 成 整数 形式 
/1 


unsigned int ToInteger (Bits& bits) 
( 
unsigned result =0; 
for (unsigned int i=0 ;i«bits.size() ; i++) 
{ 
result -result * 2 «bits[i]; 
) 
return result; 
} 
// 
// ”假设 整数 j EMMA (a0, di, d2, dB... dk-1] 


// 那么 本 函数 求 二 进 制 表 示 的 [ak -1, dk -2, ...d3, a2, di, ao] MM 


// 
unsigned int rev (unsigned int j, unsigned int k) 
{ 

Bits bits - ToBinary (j, k); 


for (unsigned i =0; i«k/2; i++) 


{ 
unsigned char temp = bits{i]; 
bits[i] =bits[k-1-i]; 
bits[k -1- i] =temp; 

) 


return ToInteger (bits); 
) 
// MÆR -1 的 单位 根 
COMPLEX w {int n, int power) 
{ 
power = power % n; 
double u=2 * PI * power /(double)n; 
// 判断 几 个 特殊 值 
double threshold =0. 0000000001; 
if (abs (u - 0) «threshold) 
{ 
return COMPLEX (1, 0); 
} 
else if (abs (u -HalfPI) «threshold) 
{ 
return COMPLEX (0, 1); 


} 
else if (abs (u - PI) < threshold) 
{ 
return COMPLEX ( -1, 0); 
} 


else if (abs (u -3 * HalfPI) <threshold) 
{ 
return COMPLEX (0, -1); 
} 
else if(abs(u-2 * PI) <threshold) 
{ 
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return COMPLEX (1, 0); 


) 
else 
( 
return COMPLEX (cos (u), sin(u)); 
} 
} . 
void SimplifiedFFT (vector < COMPLEX >a, vector < COMPLEX > & b) 
( 
//a 的 长 度 必须 是 2 个 n 次 方 
int n= (int)a size(); 
int k- (int)log2 (n); 
int 1Max =n ; 
int mMax =k +1; 
vector < COMPLEX >R; 
vector < COMPLEX > 8; 
R=a; 
for(int 1=0; 1<k; 1++) 
{ 
S=R; 
for(int i=0; i<n; i++) 
{ 
Bits bits =ToBinary (i, k); 
Bits SIndexBits = bits; 
SIndexBits{1] =0; 
Bits windexBits; 
for (int index =1; index > =0; index- -) 
{ 
wIndexBits. push back (bits [index]); 
} . 
for (int index =1 +1; index < (int)bits. size(); index ++) 
{ 
wIndexBits. push | back (0); 
} 
Bits SIndexBits2 =bits; 
SIndexBits2 {1] =1; 
int SIndex = ToInteger (SIndexBits) ; 
int wIndex = ToInteger (wIndexBits) ; 
int SIndex2 = ToInteger (SIndexBits2); 
R[i]-S(SIndex] +w(n, wIndex) * S[SIndex2]; 
) 
} 
b. resize(n); 
for(int i=0; i<n; i++) 
{ 
b[i} =R{rev(i, k)]; 
} 
} 


void TestSimplifiedFFT() 
{ 
int n=8; 
vector < COMPLEX > a; 
vector < COMPLEX > b; 
for(int i=0; i<n; i++) 
{ 
a. push_ back (COMPLEX (i, 0)); 
) 
SimplifiedFFT (a, b); 
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for (vector < COMPLEX >:: iterator it =b. begin(); 
it ! =bend(); 
it ++) 


cout << it -»real() <<" «i* "<< it -»imag() ««endl; 


) 


int main() 

( 
TestSimplifiedFFT(); 
system ("pause"); 
return 0; 


) 


A.30 求 整数 倒数 的 算法 


#include < iostream > 

#include < vector > 

#include < assert. h > 

using namespace std; 

/f RECIPROCAL 

// THR: 求 整 数 倒 数 

// M: void RECIPROCAL (BitArray& P, BitArray& Value) 


// WA: 

"7 BitArray& P: BIT 方式 表示 的 整数 

// WA: 

HH BitArray& Value: “BiT 方 式 表示 的 P 的 倒数 
// ”测试 函数 : TestRECIPROCRAL () 

// RA: 

// P: [10011001] 

// WW: 

// Value: [011010110] 

// 

// | 


// 为 了 简化 操作 ， 使 用 unsigned char 来 表示 一 个 bit 
// bitki: 将 一 个 整数 表示 为 一 系列 的 bit imo 进 制 数 {10111] 表示 为 1, 1, 1, 0, 1 : 
// | 
class BitArray : public vector «unsigned char > 
( 
public: 
BitArray& operator = (const BitArray& other) 
{ 
this ->clear(); 
this -> resize (other. size()); 
for (unsigned int i=0; i<other. size(); i++) 
{ 
(* this) [i] =other[i]; 
} 
return * this; 
} 
BitArray operator* (const BitArray& other) 
{ 
BitArray result; 
for (unsigned i =0; i<other. size(); i++) 
{ 
BitArray temp; 
for (unsigned j =0; j <i; j++) 
{ 
temp. insert (temp. begin(), 0); 
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for (unsigned j =0; j «this ->size(); j++) 
{ 
temp. push_ back {other {i] * (* this){j]); 


temp. RemoveZero(); 
result = result «temp; 


result. Smooth(); 


) 
result. Smooth (); 
return result; 
) 
BitArray operator + (const BitArray& other) 
( 
BitArray a; 
unsigned i =0; 
for(iz0;i«this-»size() && i<other. size() ; i++) 
( 
a. push | back((* this) [i] +other[iJ); 
) 
if(i<this -»size()) 
( 
for(; i<this ->size(); i++) 
{ 
a. push_ back((* this) (iJ); 


} 
else if (i<other. size()) 
{ 
for(; i <other. size(); i++) 
{ 
a. push_ back (other [i]); 


} 

a. Smooth () ; 

return a; 
} 
bool operator < = (const BitArray& other) 
{ 

if (this -»size() «other. size()) 


( 
return true; 
) 
if (this ->size() »other. size()) 
{ 
return false; 
} 


BitArray result; 
for (unsigned i=0; i<other. size(); i++) 


{ 
if((* this) [i] > -otheríi]) 
{ 
result. push_ back((* this) [i] -other[i]); 
} 
else 
{ 


if((* this) [i+1] = =0) 
{ 
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return true; 


) 
else 
( 
(* this)[i«1)- =1; 
result. push_ back(1); 
} 
} 
} 
result. RemoveZero(); 
if (result. size() = =0) 
{ 
return true; 
} 
else 
{ 
return false; 


} 
) . 
BitArray operator - (const BitArray& other) 
{ 
// W this 的 值 比 other 要 大 
assert (this ->size() > =other. size()); 
if (this ->size() = =other. size()) 
{ 


assert ((* this) [this -»size() -1] > =other[other. size() -1]); 


} 
BitArray result; 
BitArray tempThis =* this; 
unsigned inti =0; 
for(i =0; i<other. size(); i++) 
{ 
if ((tempThis) {i] > -other[il) 


{ 
result. push | back ( (tempThis) [i] - other[i]); 
} 
else 
{ 


// Wir 


unsigned int j =0; 


for (j =i+1; j <tempThis. size(); j++) 


{ 

if((tempThis)[j] >0) 

{ 

break; 

} 
} 
(tempThis){j} - =1; 
for (unsigned k=j-1; k»i; k- -) 
{ 

(tempThis) {kX] + =1; 
} 
if(j ! =i) 
( 


(tempThis) [i] =2; 
(tempThis)[i]- =1; 
H 
assert ((tempThis) [i41] > =0); 
result. push, back(1); 
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) 
if(i«tempThis. size()) 
{ 
for(; i<tempThis. size(); i++) 
{ 
result. push, back ((tempThis(i])); 
} 


} 
result. RemoveZero(); 
return result; 


} 


friend ostream& operator << (ostream& o, const BitArray& a) 
( 
for(inti-(int)a size()-1;i» :0;i- -) 


( 
o«« (int)a[i]: 
) 
o «« endl; 
return 0; 
} 
private: 
void RemoveZero () 
{ 
unsigned int length = (unsigned int)this ->size(); 
for(int islength-1; i» =0; i- -) 
{ 
if((* this) [i] = =0) 
{ 
this -> erase (this -»begin() +i); 
) 
else 
{ 
return; 
} 
} 
} 
void Smooth () 
{ 


for (unsigned int i =0; i«this ->size() ; i++) 
{ 

unsigned char a= (* this) [i]; 

(* this) [i] =a% 2; 


if(i! =this ->size() -1) 
{ 

(* this) [i +1] =(* this) (1«1] «a /2; 
} 
else 
{ 

if(a/2= =0) 

{ 

return; 

} 

else if (a /2= =1) 

{ 


this ->push_ back (a /2); 
} 
else 
{ 


assert (false); 
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} 
} 
} 
}; 
// 
// ” 求 最 接近 k 的 2 的 n 次 方 
// 


int GetPowerOfTwo (int k) 
{ 
int result =1; 
while( k»result) 
{ 
result =result <<1; 
} 
return k; 
} 
void RECIPROCAL (BitArray& P, BitArray& Value) 
{ 
int k= (int )P. size(); 
if (P. size() = =1) 
{ ^ 
// 返回 [1L，0] 
Value. clear (); 
Value. resize (2); 
Value[0] 20; 
Value[1] =1; 
) 
else 
( 。 
int needLength = Get PowerOfTwo (k); 
// 如 果 p 不 是 2 的 n 次 方 , 那么 插入 额外 的 0 
for(int íi =0; i<needLength -k ; i++) 
{ 
P. insert (P. begin(), 0); 
} 
int actualLength =k; 
k  -needLength; 
int kDivideByTwo =k / 2; 
BitArray PDivideByTwo; 
PDivideByTwo. resize (kDivideByTwo) ; 
for( int i= (int)P.size() -1; i» = (int)P. size() - kDivideByTwo; i- -) 
( 
PDivideByTwo [i - (P. size() - kbivideByTwo)] - P[i]; 
) 
BitArray C; 
RECIPROCAL (PDivideByTwo, C); 


// 加 (3* xk /2) 个 0 到 c 的 末尾 ， 得 到 C* 2^(3* k 7/2) 
BitArray CTemp =C; 
for(int i=0; i<3 * k/2; i++) 
{ 
CTemp. insert (CTemp. begin(), 0); 
} 


BitArray D; 
DzCTemp-C* C* P; 
if(D size() ! =2* k) 
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// Abo 
D. push_ back (0); 


BitArray A; 
A resize(k +1); 
for(int i=k; i> =0; i- -) 
{ 
A[i] =D[i +D size() - (k+1)]; 


for(int i=2; i> =0; i- -) 

{ 
BitArray TwoPowerl; 
TwoPowerl. resize(i+1); 
TwoPowerl [i] =1; 
BitArray TwoPowerDoubleKMinusOne; 
TwoPowerDoubleKMinusOne. resize (2 * k); 
TwoPowerDoubleKMinusOne[2 * k-1]=1; 


if ( (A + TwoPowerI) * P< - TwoPowerDoubleKMinusOne) 
{ 
A =A + TwoPowerI; 


} 
Value =A; 
for(int i =0; i«needLength -actualLength ; i ++) 
{ 
Value. erase (Value. begin()); 


) 
void TestRECIPROCAL() 
{ 
BitArray P; 
BitArray Value; 


P. resize (8); 
P[0] =1; 
P[3] 21; 
P[4] 21; 
P[7] 21; 
cout << "P" << endl; 
cout <<P; 
RECIPROCAL (P, Value); 
cout «« "Value" «« endl; 
cout << Value; 

} 

int main () 

{ 
TestRECIPROCAL (); 
system ("pause") ; 
return 0; 


} 


A. 31 求 多 项 式 的 倒数 算法 


#include < iostream > 
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#include < vector > 

#include «assert. h» 

using namespace std; 

// RECIPROCAL 

// DR: 求 多 项 式 的 倒数 算法 实现 


/1 M&M: CoefficientArray RECIPROCAL (CoefficientArray& A) 


// 输入 : 

// CoefficientArray& À: 用 多 项 式 系数 表示 的 多 项 式 
// 输出: 

/1/ CoefficientArray: 用 多 项 式 系数 表示 的 多 项 式 A 的 倒数 
// ”测试 函数 ; TestRECIPROCAL () 

Ho MA: 

/1 A: X - X! +X +2X - X! -3X +X+4 

// 表示 为 : (4,1, -3, -1, 2,1, -1, 1] 

// 输出: 

// X «x5 -3X4 - AY! «3X! 415X412 

// 表示 为 : (12, 15, 3, -4, -3, 0, 1, 1) 


// 使 用 多 项 式 的 系数 来 表示 一 个 多 项 式 ， 高 位 在 后 ， 低 位 在 前 
// 例如 : x! -x* +X +2X' - X! -3X +X+4 

// BRA: (4,1, -3, -1, 2, 1, -1, 1] 

class CoefficientArray : public vector « double » 

{ 

public: 


CoefficientArray& operator = (const CoefficientArray& other) 


{ 
this ->clear(); 
this -> resize (other. size()); 
for (unsigned int i =0; i<other. size(); i++) 
{ 
(* this) [i] =other [i]; 
} 
return * this; 
). 
CoefficientArray operator* (double coeff) 
{ 
CoefficientArray result =* this; 
for (unsigned i =0; i«result.size(); i++) 
{ 
result [i] =result [i] * coeff; 
} 
result. RemoveZero(); 
return result; 
} 


CoefficientArray operator* (const CoefficientArray& other) 


{ 
CoefficientArray result; 
for (unsigned i =0; i<other. size(); i+) 
{ 
CoefficientArray temp; 
,for (unsigned j =0; j «i; j++) 
{ 
temp. insert (temp. begin(), 0); 
) 
for (unsigned j 2-0; j«this ->size(); j ++) 
( 
temp. push | back(other[i] * (* this) [j)); 
) ; 


result = result «temp; 
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result. RemoveZero(); 
return result; 


CoefficientArray operator - (const CoefficientArray& other) 


( 
CoefficientArray result; 
CoefficientArray tempThis = * this; 
unsigned inti  -0; 
for (i=0; i<other. size() && i<this ->size(); i++) 
{ 
result. push | back((* this) [i] -other [i]); 
} 
if(i<this ->size()) 
{ 
for(; i<this ->size(); i++) 
{ 
result. push_ back( (* this) (iJ); 
} 
} 
else if (i < other. size()) 
{ 
for(; i<other. size(); i++) 
{ 
result. push , back( - other[i]); 
) 
} 
result. RemoveZero (); 
return result; 
} 


CoefficientArray operator + (const CoefficientArray& other) 
{ 


CoefficientArray a; 
unsigned i =0; 
for( i =0; i<this ->size() && i<other. size(); i++) 


a push_ back((* this) [i] + other[i]); 
itl this -»8ize()) 
) for(; i<this ~>size(); i++) 
a. push_ back((* this) [i]); 
) } 
else if(i«other. size()) 
) for(; i<other. size(); i++) 
a. push_ back (other [i]); 
} 


} 
a. RemoveZero() ; 
return a; 


friend ostream& operator << (ostream& o, const CoefficientArray& a) 
{ 








374 


for( int i =a size()-1;i»-0;i--) 
{ 
if(is-1) 
{ 
if(a[i] ! z1) 
{ 
ox<<ali]; 
} 
o << "X"; 
if(a[0] > =0) 
{ 
o<<" +"; 
) 
continue; 
H 
if(i= =0) 
( 
o<<a(lil; 
o << endl; 
continue; 
} 
if(a[i] ! =1) 
{ 
o««ali]; 
) 
if(i! =0) 
( 
DO<< "x" «i; 
if(a[i-1] > =0) 
{ 
Occ" +"; 
} 
} 
} 
return o; 
) 
private: 
void RemoveZero () 
{ 
unsigned int length =this -> size(); 
for(int i =length-1; i> =0; i- -) 
{ 
if ((* this) [i] = =0) 
{ 
this -> erase (this -> begin() +i); 
) 
else 
{ 
return; 
} 
} 
} 


Me 
CoefficientArray RECIPROCAL (CoefficientArray& A) 
( 

int k= (int)A size(); 


if(A size() = -1) 
( 
CoefficientArray result; 
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result. push_ back (1. 0 / A(0]); 
return result; 
} 
CoefficientArray AKDiviedByTwo; 
AKDiviedByTwo. resize(k / 2); 
for (unsigned i =k / 2; i<k; i++) 
{ 
AKDiviedByTwo[i -k / 2] -A[il: 
) 


CoefficientArray Q = RECIPROCAL (AKDiviedByTwo) ; 


CoefficientArray Ql =Q* 2; 
// RU x^(3/2) * k-2) 
// 由 于 k 是 2 的 n 次 方 ， 所 有 temp 是 个 整数 
int temp =3* k/2-2; 
for(int i =0; i<temp; i ++) 
{ 
Ql. insert (Q1. begin(), 0); 
} 
CoefficientArray R=Q1-Q* Q* A; 
if(k-2 ! =0) 
( 
R erase (R begin(), R begin() + (k-2) ); 
) 
return R; 
) 
void TestRECIPROCAL () 
{ 
CoefficientArray a; 
& push_ back (4) ; 
a push , back (1); 
a push, back ( -3); 
a push_ back( -1); 
a push_ back (2) ; 
a push | back(1); 
a. push | back( -1); 
a push_ back (1) ; 


cout <<a; 
CoefficientArray S =RECIPROCAL(a); 
cout «« S; 

) 

int main() 


{ 
Test RECIPROCAL (); 
system ("pause") ; 
return 0; 


} 


A.32 求 一 个 整数 的 多 个 余数 的 算法 


#include < iostream > 

#include < vector > 

#include < cmath > 

using namespace std; 

// RESIDUES 

// WB: 求 一 个 整数 的 多 个 余数 


// MM: void RESIDUES (vector «int >& P, int u, vector < int >& results) 
// A: 
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// vector < int >& P: 一 个 素数 的 数组 

/1/ intu: 整数 u 

// RW: 

// vector < int >& results: u 除 以 P 中 素数 的 余数 

// ”测试 函数 : TestRESIDUES () 

// WA: 

// P: [7, 5, 3, 2] 

// u: 201 

// Meth: 

// results: [5, 1, 0, 1] 

FA 
矩阵 类 : 


封装 一 部 分 和 矩阵 基本 操作 


eee RR kek RRR eR eR A eee eek ke ee j 
class Matrix 


public: 
Matrix(int row, int col) 
{ 
int i=0; 
this ->m_ ppData = NULL; 
this -»m iRow=0; 
this ->m_ iCol =0; 
if(row« =0 | col < =0) 
{ 
return; ` 
} 
this ->m_ iRow = row; 
this ->m_ iCol =col; 
this ->m_ ppData = new int* [row]; 
for(i =0; i<row; i++) 
{ 
this ->m_ ppData[i] =new int [col]; 
memset (this ->m_ ppData[i], 0, sizeof(int) * this ->m_ iCol); 
} 
} 
Matrix(const Matrix& other) 
( 
this -»operator - (other); 
} 
~Matrix() 
{ 
ClearMemory (); 
} 
int* operator [] (int rowIndex) 
{ 


int* pData = NULL; 
if (rowIndex > =0 && rowIndex «this ->m_ iRow) 


{ 
if (this ->m_ ppData ! - NULL) 
{ 
pData =this ->m_ ppData [rowIndex]; 
} 


} 
return pData; 
} 
int GetRowCount () { return m_ iRow;} 
int GetColumnCount () { return m_ iCol;} 
private: 
void ClearMemory () 
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int i=0; 
if (this ->m_ ppData ! =NULL) 
{ 
for(i =0; i«this-»m, iRow; i ++) 
( 
delete [] (this -»m, ppData[i]); 
this ->m_ ppData[i] - NULL; 
) 
delete [jthis ->m_ ppData; 
this ->m_ ppData -NULL; 
) 
) 
private: 
int* * m  ppData; 
int m, iRow; 
intm, iCol; 
}; 
// 
// ”计算 以 2 为 底 的 log 
// 
double log2 (double a) 
( - 
return log(a) / log(2. 0); 
} 
void RESIDUES (vector <int >& P, int u, vector <int >& results) 
{ 
// P 的 大 小 必须 是 2 的 n 次 方 
int k= (int)P. size(); 
int t = (int) log2 (k); 
Matrix Q(k, t); 
Matrix U(k, t +1); 


for(int i=0; i<k; i++) 
Qíili0)] « Pli); 
tor (int j <1; j<t; j++) 
for(int i=0; i<k; i+ = (int)pow(2.0, j)) 
Qli} (5) QIil(3 -1] * Qli+ (int)pow(2.0, 3-1)](3 - 13; 
) } 


U[0] [t] =u; 


for(int j=t; j >0; j- -) 


{ 
for(int i=0; i<k; i+ = (int) pow(2.0, j)) 
{ 
Uli) [3-1] =Uli] [5] $ Qli]{j-1}; 
U[i-(int)pow(2.0, j-1)][j -1] -Ufil[j] $ Q[i + (int)pow(2.0, j -1)][j -1]; 
) 
) 
for(int i =0; i<k; i++) 
{ 


results. push | back ((int)U[i] [0]); 
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) 
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} 
return; 


void TestRESIDUES () 


{ 


} 


vector < int >P; 

vector < int > results; 

P. push_ back(7) ; 

P. push, , back (5); 

P. push_ back (3); 

P. push_ back (2) ; 

int u=201; 

RESIDUES (P, u, results); 

for (vector «int > : : iterator it - results. begin(); 
it! =results. end(); 
it e) 


cout << * it << endl; 
} 


int main() 


{ 


} 
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TestRESIDUES () ; 
system ("pause"); 
return 0; 


从 一 系列 余数 求 原始 数 的 算法 


#include < iostream > 
#include < vector > 
#include < cmath > 
using namespace std; 


// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 
// 


ChineseRemainder 
功能 : 从 一 系列 余数 中 求 原始 值 - 
函数 : int ChineseRemainder (vector «int >& P, vector < int >& D, vector < int >& U) 
WA: 
vector < int >& P: 一 个 素数 的 数组 ，P 的 大 小 是 2 的 次 方 
vector < int >& D: 一 个 整数 数组 , Di = ((P/Pi) 70) & Pi 
vector«int»&U: u BRE 中 素数 的 余数 数组 


int: Bit 
测试 函数 : TestChineseRemainder () 
测试 数据 : 
P: [2, 3, 5, 7] 
U: (1, 2, 4, 3] 
D: (1, 1, 3, 4] 
测试 结果 : 
原始 值 : 58 


输出 : 


{tee ee eR rhe eRe Re RAR ARR AAR eH eR AR 罕 吝 生 


和 矩阵 类 : 
封装 一 部 分 矩阵 基本 操作 


WOW S X X 0k 00k 09 OR 9 0o GU GO 0 Ug UR OOo o Wo d o o n od *ok x v / 


class Matrix 


( 


public: 





Matrix(int row, int col) 
( 
int i=0; 
this ->m_ ppData = NULL; 
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this ->m_ iRowz0; 
this ->m iCol =0; 
if(row« =0 | col < =0) 
{ 
return; 
} 
this ->m_ iRow = row; 
this ->m_ iCol =col; 
this -> mL ppData = new int* [row]; 
for(i =0; i<row; i++) 
{ 
this ->m_ ppData[i) =new int [col]; 
memset (this ->m_ ppData[i], 0, sizeof(int) * this ->m_ iCol); 


} 
} 
-Matrix() 
( 
ClearMemory (); 
} 
int* operator [] (int rowIndex) 
{ 
int* pData =NULL; 
if (rowIndex > =0 && rowIndex «this ->m_ iRow) 
{ 
if (this ^m ppData ! =NULL) 
{ 
pData = this ->m_ ppData [rowIndex] ; 
} 
} 
return pData; 
} 


int GetRowCount () ( return m, iRow;] 
int GetColumnCount () { return m_ iCol;} 
private: 
void ClearMemory () 
{ 
int i=0; 
if (this ->m ppData ! =NULL) 
{ 
for(i=0; i<this ->m iRow; i ++) 
{ 
delete [] (this ->m_ ppData[i]); 
this ->m_ ppData[i] =NULL; 
) 
delete []this ->m_ ppData; 
this -»m, ppData - NULL; 


) 

private: 
int* * m ppData; 
int m_ iRow; 


int m, iCol; 
un 
// 求 D 值 
int GetD(int C, int P) 
t 
int k=1; 
while (true) 
{ 


if((k* C) $ P= -1) 
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{ 
return k; 
} 
else 
{ 
k++; 
} 
} 
} ^ 
// 
// “计算 以 2 为 底 的 log 
// 
double log2 (double a) 
{ . 
return log(a) / 1og(2.0); 
} 
int ChineseRemainder (vector «int »& P, vector «int >& D, vector «int >& U) 
( 


int k= (int)P. size(); 
int t = (int) log2 (k); * 
Matrix S(k , t+1); 
Matrix Q(k, t +1); 
for(int i=0; i<k; i++) 


Q(i] (0) -P[il: 
tor (int j=l; j< =t; j++) 
for(int i =0; i<k; i+ = (int)pow(2.0, j)) 
QCA) [j] sQ[il[j -1) * Q[li + (int)pow(2.0, 3 -3)]) [3 - 1]; 
) 
for(int i =0; i<k; i++) 
S[i][0] -D[i] * Uli]; 
tor (int j=l; j< =t; j++) 
{ 


for(int i =0; i<k; i+ = (int)pow(2.0, j)) 
{ 
S(iltjlsSli](j -1] * Q[i + (int) pow(2.0, 3-1)](j -1] +S{i+ (int)pow(2.0, j -1)] 
(j -1) * Qlilli -11: 


) 
) 
return S(0]I[t] $ Q[0][t]; 
} 
void TestChineseRemainder () 
{ 


vector «int >P; 

P. push_ back (2); 
P. push_ back (3); 
P. push_ back (5); 
P. push_ back (7); 
vector <int >U; 

U. push_ back(1); 
U. push_ back (2); 
U. push_ back (4); 
U. push_ back (3); 
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vector < int >D; 


int c=1; 
for (int i=0; i< (int)P. size(); i++) 
{ 
c=c* P[i) 
} 
for(int i =0; i< (int)P. size(); i++) 


{ 
D. push_ back (GetD(c / P[i], P{il)); 
) 
int u =ChineseRemainder (P, D, U); 
cout << u << endl; 


} 

int main() 

{ 
TestChineseRemainder () ; 
system ("pause"); 
return 0; 

} 


A.34 扩展 的 欧 几 里 得 算法 


#include < iostream > 

#include < vector > 

#include < cmath > 

using namespace std; 

// ExtGCD 

// ”功能 扩展 的 殉 几 里 得 算法 


// MM: void ExtGCD(int a0, int al, int &a, int & x, int& y) 


// GA: 

// int a0: 正 整 数 ad 

// int al: EW% al 

// ”输出 : 

// int a: a0 和 al 的 最 大 公约 数 

/1 int x, y 整数 x 和 y, 使 得 a0 * x+al* y=a; 
// ”测试 函数 : TestExtGCD () 

// HA: 

// a0: 57 

// al: 33 

// Sá: 

// a:3 

// x: -4 

// y:7 

void ExtGCD(int a0, int al, int & a, int & x, int& y) 
( 


vector «int >A; 

vector «int >X; 

vector «int >Y; 

A push_ back (a0) ; 

A push , back (al); 

X push, back(1); 

X push | back (0); 

Y. push_ back (0) ; 

Y. push_ back (1) ; 

int i=1; 

while(A[i-1] % Ali] ! =0) 

{ 
int q= (int) floor ((A[i-1] * 1.0 /A[i])); 
A push_ back(A[i-1]-q* Alij); 
X push_ back (X[i~1]-q* X[i]); 
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Y. push_ back(Y(i-1)-q* Y[il): 
izis1; 

) 
azA[il: 
xzX[il; 
y=Y[i]; 
return; 

) 

void TestExtGCD () 

{ 
int a0 =57; 
int al =33; 
int a=0; 
int x=0; 
int y =0; 
ExtGCD(a0, al, a, x, y): 
cout <<a << endl; 
cout «« x << endl; 
cout «« y << endl; 

} 

int main() 

{ 
TestExtGCD(); 
system ("pause"); 
return 0; 


} 


A 35 HGCD 算法 


#include < iostream > 

#include < vector > 

#include < cmath > 

#include < assert. h > 

using namespace std; 

// HGCD 

// TAM: oR2 个 多 项 式 的 半 公 约 数 


// MM: PolynomialMatrix HGCD (CoefficientArray& a0, CoefficientArray& al) 


// MA: 

// CoefficientArray& a0: 用 系数 数组 表示 的 多 项 式 a0 
// CoefficientArray& al: 用 系数 数组 表示 的 多 项 式 al 
// hn 

H PolynomialMatrix : 一 个 多 项 式 的 矩阵 

// ”测试 函数 : TestHGCD () 

// WA: . 

/1/ a0: X «x* X! «X! «x 41 

// al: X -2 X! +3X - x -7 

// 95: 

// I 1 - (x43) 
// | 

// I 

// | - (1/4 * x-1 /16) 1/4 * x «11/16 * x+13/16 


// 使 用 多 项 式 的 系数 来 表示 一 个 多 项 式 ， 高 位 在 后 ， 低 位 在 前 
// 例如 : x’ -X «x? +2X -X -3X «x44 
// BRA: (4,1, -3, -1, 2, 1, -1, 1] 
// 
class CoefficientArray : public vector < double > 
(t 
public: 
int DEG() const 
{ 
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) 


for (int i= (int)this ->size() -1; i» 20; i++) 
{ 

if((* this) {i] ! =0) 

{ 


return i; 


} 


return 0; 


CoefficientArray& operator = (const CoefficientArray& other) 


{ 


} 


this ->clear(); 
this -> resize (other. size()); 
for (unsigned int i=0; i«other. size() ; i++) 
{ 
(* this) [i] =other[i]; 
} 
return * this; 


CoefficientArray operator* (double coeff) 


{ 


} 


CoefficientArray result =* this; 
for (unsigned i=0; i«result.size(); i++) 
{ 
result [i] = result [i] * coeff; 
} 
result. RemoveZero(); 
return result; 


CoefficientArray operator* (const CoefficientArray& other) 


( 


) 


CoefficientArray result; 
for (unsigned i -0; i«other. size(); i++) 
( 
CoefficientArray temp; 
for (unsigned j 20; j <i; j++) 
{ 
temp. insert (temp. begin(), 0); 
) 
for (unsigned j -0; j«this-»size(): j++) 
{ 
temp. push_ back(other[i] * (* this) (j]); 


result =result + temp; 
} 
result. RemoveZero (); 
return result; 


CoefficientArray operator % (const CoefficientArray& other) 


{ 


} 


CoefficientArray result; 
this -> DivideBy (other, result); 
return result; 


CoefficientArray operator / (const CoefficientArray& other) 


{ 


CoefficientArray result; 
CoefficientArray residue; 
result =this -> DivideBy (other, residue); 
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return result; 


} 
bool CanDivideBy (CoefficientArray& other) 
{ 
CoefficientArray moduloResult =* this % other; 
if (moduloResult. size() = =0) 
{ 
return true; 
} 
return false; 
} 
CoefficientArray operator - (const CoefficientArray& other) 
( 


CoefficientArray result; 
CoefficientArray tempThis - * this; 
unsigned inti =0; 
for (i =0; i<other. size() &ki«this ->size(); i++) 
L 
result. push | back((* this) [i] -other[i]); 
) 


if(i<this ->size()) 


( 
for(;i«this-»size(); i++) 
{ 
result. push | back((* this) [i]); 
} 
} 


else if (i «other. size()) 
{ 
for(; i<other. size(); i ++) 
{ 
result. push_ back( -other{i]); 


} 
result. RemoveZero(); 
return result; 


CoefficientArray operator « (const CoefficientArray& other) 
( 

CoefficientArray a; 

unsigned i =0; 

for(i=0; i<this ->size() && i<other. size(); i++) 


a push_ back((* this) [i] +other[iJ); 
it cthis ->size()) 
for(; i<this ->size(); i++) 
a. push | back((* this) [i]); 
) 
else if (i <other. size()) 
{ 


for(; i<other. size(); i++) 
{ 
a. push_ back (other [i]); 
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} 


friend ostream& operator << (ostream& o, CoefficientArray& a) 


t 


{ 
if (i = =1) 
{ 
if(a[i] ! =1) 
t 
o««aíi]; 
} 
O «« "x"; 
if (a[0] > =0) 
{ 
o<<c* e; 
} 
continue; 
} > 
if(is =0) 
{ 
o«ca(il; 
o «« end1; 
continue; 
) 
if(afi)] ! =1) 
t 
o«ca[il; 
) 
if(i! =0) 
( 
O«« "x" «ci; 
if(a[i-1] > =0) 
{ 
o<<" +"; 
} 
} 
} 
return o; 
} 
private: 


} 
a RemoveZero(); 
return a; 


for( int i= (int)a size() -1; i> =0; i- -) 
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CoefficientArray DivideBy (const CoefficientArray& divisor, CoefficientArray& residue) 


{ 


CoefficientArray result; 
CoefficientArray dividend =* this; 


residue =* this; 


if (this ->size() = =0 || this -» DEG() «divisor. DEG()) 


{ 
return result; 


do 


dividend = residue; 
int m=dividend DEG(); 
int nzdivisor. DEG(); 
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CoefficientArrày quotient; 

quotient. resize(m-n 41); 

quotient [m -n] -dividend[m) / divisor[n]: 
residue = dividend -quotient * divisor; 
result -result «quotient; 


)while(! (residue. size() = =0 | residue. DEG() «divisor. DEG())); 


return result; 


void RemoveZero() 


( 


int length = (int)this -»8ize(); 
for(int izlength-1; i> =0; i- -) 


{ 
if((* this) {i] = =0) 
{ 
this -> erase (this -»begin() +i); 
} 
else 
{ 
return; 
} 
} 
} 
}; 
// 
// ”多 项 式 矩阵 
// 
class PolynomialMatrix 
{ 
public: 
PolynomialMatrix (int row, int col) 
( 
int i=0; 
this ->m_ ppData = NULL; 
this ->m_ iRow=0; 
this ->m_ iCol =0; 
if(row« =0 | col < =0) 
{ 
return; 
} 
this ->m_ iRow = row; 
this ->m_ iCol =col; 
this ->m_ ppData = new CoefficientArray* [row]; 
for(i =0; i<row; i++) 
{ 
this ->m_ ppData [i] =new CoefficientArray [col]; 
} 
} 
PolynomialMatrix (const PolynomialMatrix& other) 
{ 
this -> operator = (other); 
} 
~ PolynomialMatrix () 
{ 
ClearMemory (); 
} 


CoefficientArray* operator {] (int rowIndex) 


( 
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CoefficientArray* pData -NULL; 
if (rowIndex > 20 && rowIndex < this ->m_ iRow) 
{ 
if (this ->m_ ppData ! =NULL) 
{ 
pData = this ->m_ ppData[rowIndex] ; 


} 
return pData; 
} 
PolynomialMatrix operator * (const PolynomialMatrix& other) 
{ 
int i=0; 
int j =0; 
int K=0; 
PolynomialMatrix result (this ->m_ iRow, other. m_ iCol); 
if (this -»m, iCol ! -other.m, iRow) 
( 
assert (0) ; 
return result; 
) 
for(i-0;i«result.m iRow; i++) 
{ 
for(j =0; j«result.m, iCol; j ++) 


{ 
for(k =0; k«this ->m iCol; k++) 
{ 
result [i] [j] = result [i] [j] + 
const, cast < PolynomialMatrix & > (* this) [i][k] * 
const_ cast < PolynomialMatrix & > (other) (k) [j]; 
} 
} 
} 
return result; 
} 
PolynomialMatrix& operator = (const PolynomialMatrix& other) 
t 
if (&other = -this) 
( 
return * this; 
) 
int i=0; 
this ->m_ iCol = other. m_ iCol; 
this ->m_ iRow = other. m_ iRow; 
this ->m_ ppData = new CoefficientArray* [this ->m_ iRow]; 
for(i =0; i«this-»m  iRow; i++) 
{ 
this ->m_ ppData[i] = new CoefficientArray [this ->m_ iCol]; 
for(int j =0; j<this ->m iCol; j ++) 
{ 
(const, cast < PolynomialMatrix * > (this) ->m_ ppDatalil])[jls 
const, cast < PolynomialMatrix & > (other) [i] [j]; 
} 
} 
return * this; 
} 
friend ostream& operator << (ostream& o, const PolynomialMatrixé a) 
{ 


for(int i=0; i<am_ iRow; i ++) 
{ 
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for(int jz0; j«a m, iCol; j ++) 
( 
o<<a m_ ppData[i] [j] <<endl; 


) 

return o; 
) 
int GetRowCount () ( return m, iRow;] 
int GetColumnCount () ( return m | iCol;) 


private: 
void ClearMemory () 
{ 
int i=0; 
if (this ->m_ ppData ! =NULL) 
{ 
for (i=0; i<this ->m_ iRow; i++) 
{ 
delete [] (this ->m_ ppData[i]); 
this ->m_ ppDataí[i) «NULL; 
) 
delete []this -»m  ppData; 
this ->m_ ppData = NULL; 
) 
} 
private: 


CoefficientArray* * m ppData; 

int m_ iRow; 

int m, iCol; 
}; 
PolynomialMatrix HGCD (CoefficientArray& a0, CoefficientArray& al) 
{ 

int m= (int) floor (a0. DEG() / 2.0); 

if (al. DEG () < =m) 


{ 
PolynomialMatrix result (2, 2); 
result [0] [0]. push_ back (1); 
result [1] [1]. push_ back (1); 
return result; 

} 

else 


{ 


CoefficientArray b0; 
CoefficientArray c0; 
for(int i=0; i<m; i++) 
{ 
c0. push_ back (a0 [1]) ; 
) 
for(int i=m; i< (int)a0. size(); i++) 
{ 
bO. push_ back (a0 [i]); 
} 
CoefficientArray bl; 
CoefficientArray cl; 
for(int i=0; i<m; i++) 
{ 
c1. push. back (al [i}); 
} 
for(int i =m; i< (int)al.size(); i++) 
{ 
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) 


bl. push_ back(al[i]); 
} 
PolynomialMatrix R =HGCD(b0, bl); 
PolynomialMatrix MatrixAQAndAi (2, 1); 
MatrixAOAndAl [0] [0] =a0; 
MatrixAOAndAl [1] [0] =al; 
PolynomialMatrix MatrixDAndE =R * MatrixAQAndAl ; 
CoefficientArray d -MatrixDAndE[0] [0]; 
CoefficientArray e =MatrixDAndE [1] [0]; 
CoefficientArray f-d $ e; 
int mDivideTwo =m / 2; 
CoefficientArray g0; 
CoefficientArray h0; 
for(int i=0; i«mDivideTwo; i ++) 
{ 

h0. push_ back(e([i]): 


for(int i =mDivideTwo; i < (int)e size(); i++) 
{ 
g0. push, back(e[i]); 
) 
CoefficientArray gl; 
CoefficientArray hl; 
for(int i =0; i«mDivideTwo; i ++) 


{ 
hl. push_ back (f£[i}); 
} 
for (int i =mDivideTwo; i< (int)f. size(); i++) 
{ 


gl. push_ back (f {i]); 
} 
PolynomialMatrix S =HGCD(g0, gl); 
CoefficientArray q=d/e; 
PolynomialMatrix M(2, 2); 
M[0] [1]. push_ back (1); 
M[1][0]. push_ back(1); 
for(int i=0; i< (int)q size(); i++) 
{ 
qafi] = -qlil; 
} 
M[1} [1] =q; 
return S* M* R; 


void TestHGCD() 


{ 


CoefficientArray pl; 


pl. 
pl. 
pl. 
pl. 
pi. 
pl. 


push, back(1); 
push_ back (1); 
push_ back (1); 
push_ back (1); 
push_ back (1); 
push, back (1) ; 


CoefficientArray p2; 
p2. push_ back( -7); 
p2. push_ back( - 1); 
p2. push_ back (3) ; 
p2. push_ back( -2); 
p2. push_ back (1); 
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PolynomialMatrix result =HGCD(pl, p2); 
cout << result << endl; 
) 
int main() 
t 
TestHGCD(); 
System("pause"); 
return 0; 


) 


A.36 求 两 个 多 项 式 的 公约 数 


#include < iostream > 

#include < vector > 

#include < cmath > 

using namespace std; 

// GCD 

// WM: 求 两 个 多 项 式 的 公约 数 


// MM: CoefficientArray GCD(CoefficientArray& a0, CoefficientArray& al) 
// WA: 


// CoefficientArray& a0: 用 系数 数组 表示 的 多 项 式 ao 
// CoefficientArray& al: 用 系数 数组 表示 的 多 项 式 al 
// i: 

// CoefficientArray : a0 和 al 的 多 项 式 

// ”测试 函数 : TestGcD () 

// WA: 

// a0: X +X «X «X! +X+1 

// al: X! - 2 X! «3X! -X-7 

// 输出: 


// 3952x «3952 
// 使 用 多 项 式 的 系数 来 表示 一 个 多 项 式 ， 高 位 在 后 ， 低 位 在 前 
// Nn. X -X «x! «2x! -X -3X! «Xx «4 
// BRA: (4,1, -3, -1, 2, 1, -1, 1] 
// 
class CoefficientArray : public vector < double > 
{ 
public: 
int DEG() const 
{ 
for(int i= (int)this ->size() -1; i» -0; i++) 
{ 
if((* this) (iJ ! =0) 
{ 
return i; 
} 
} 
return 0; 
} 
CoefficientArray& operator = (const CoefficientArray& other) 
{ 
this -»clear(); 
this -> resize (other. size()); 
for (unsigned int i =0; i<other. size(); i++) 
{ 
(* this) [i] -other[i): 
) 
return * this; 
) 


CoefficientArray operator* (doubie coeff) 
{ 
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CoefficientArray result - * this; 
for(unsignedi-0; i«result.size(); i++) 
{ 

result [i] =result[i] * coeff; 
} 
result. RemoveZero (); 
return result; 


) 
CoefficientArray operator* (const CoefficientArray& other) 
( 

CoefficientArray result; 

for (unsigned i 20; i«other. size(); i++) 

{ 


CoefficientArray temp; 
for (unsigned j =0; j<i; j ++) 


{ 
temp. insert (temp. begin(), 0); 
} 
for (unsigned j =0; j«this ->size(); j ++) 
{ 


temp. push_ back(other[i] * (* this) (jl); 


result = result + temp; 

} 

result. RemoveZero (); 

return result; 
} 
CoefficientArray operator $ (const CoefficientArray& other) 
( 

CoefficientArray result; 

this -> DivideBy (other, result); 

return result; 
) 
CoefficientArray operator /(const CoefficientArrayk other) 
{ 

CoefficientArray result; 

CoefficientArray residue; 

result =this -»DivideBy (other, residue); 

return result; 


bool CanDivideBy (CoefficientArray& other) 
{ 
CoefficientArray moduloResult =* this $ other; 
if (moduloResult. size() = =0) 
{ 
return true; 
} 
return false; 
} 
CoefficientArray operator - (const CoefficientArray& other) 


( 


CoefficientArray result; 
CoefficientArray tempThis - * this; 
unsigned inti  -0; 
for(i=0; i<other. size() && i<this ->size(); i++) 
{ 
result. push | back((* this) [i] -otheríi]l): 
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} 
if(i<this -»size()) 
{ 
for(; i<this ->size(); i++) 
{ 
result. push_ back((* this) [i]); 
} 
} 
else if (i <other. size()) 
{ 
for (; i <other. size(); i ++) 
{ 
result. push_ back ( - other [i]); 
} 
} 
result. RemoveZero (); 
return result; 


CoefficientArray operator + (const CoefficientArray& other) 


{ 


} 


friend ostream& operator << (ostream& o, CoefficientArrayk a) 


{ 


CoefficientArray a; 
unsigned i =0; 
for(i-0;i«this-»size() && i<other. size(); i++) 
{ 
a push_ back((* this) [i] +other[i]); 
} 


if(i<this ->size()) 


{ 
for(; i<this ->size(); i++) 
{ 
a push, back((* this)[i]); ° 
} 
} 
else if (i <other. size()) 
{ 
for{; i<other. size(); i++) 
{ 
a push_ back (other [i]); 
} 
} 
à. RemoveZero () ; 
return a; 


for( int i= (int)a size()-1;i» -0; i- -) 
{ 
if(i= =1) 
{ 
if(a[i] ! =1) 
{ 
o<<alil; 
} 
O<< "x"; 
if(a[0] > =0) 
{ 


O<<"+"; 
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continue; 

} 

if(i= =0) 

{ 
o««a[(il; 
o «c endl; 
continue; 

} 

if(ali] ! =1) 

( 
o«caíil; 

} 

if(i! =0) 

{ 
O«c "X" «cl; 
if(ali-1]» =0) 
( 

o<<" +"; 

} 

) 

) 
return o; 
} 
private: 


CoefficientArray DivideBy (const CoefficientArray& divisor, CoefficientArray& residue) 
t 


CoefficientArray result; 

CoefficientArray dividend -* this; 

residue -* this; 

if (this ->size() = =0 || this ->DEG() «divisor. DEG()) 
( 


return result; 
do 


dividend = residue; 

int m= dividend DEG(); 

int n=divisor. DEG(); 

CoefficientArray quotient; 

quotient. resize(m-n +1); 

quotient [m -n] -dividend[m] / divisor [n]; 

residue -dividend -quotient * divisor; 

result - result «quotient; 
}while(! (residue. size() = «0 || residue. DEG() «divisor. DEG())); 
return result; 


} 


void RemoveZero () 
{ 
int length = (int)this ->size(); 
for(int iz=length-1; i> 20; i- -) 
{ 
if((* this) [i] = =0) 
{ . 
this -> erase (this -> begin() +i); 
} 
else 
{ 


return; 


}; 


// 
// 
// 


多 项 式 和 矩阵 


Class PolynomialMatrix 


( 


public: 


PolynomialMatrix (int row, int col) 


( 


) 


int i=0; 
this ->m ppData - NULL; 
this m iRow=0; 
this ->m_ iCol =0; 
if (row< =0 || col < =0) 
{ 
return; 
} 
this ->m_ iRow = row; 
this ->m_ iCol =col; 
this ->m_ ppData = new CoefficientArray* [row]; 
for(i =0; i<row; i++) 
{ 
this ->m_ ppData[i] =new CoefficientArray [col]; 


PolynomialMatrix (const PolynomialMatrix& other) 


( 


) 


this -»operator - (other); 


- PolynomialMatrix() 


( 


) 


ClearMemory (); 


CoefficientArray* operator [](int rowIndex) const 


t 


) 


CoefficientArray* pData - NULL; 
if (rowIndex > =0 && rowIndex < this ->m_ iRow) 
{ 
if (this ->m_ ppData ! =NULL) 
{ 
pData = this ->m_ ppData [rowIndex] ; 


} 
return pData; 


PolynomialMatrix operator * (PolynomialMatrix& other) 


i 


int i=0; 
int j =0; 
int k=0; 
PolynomialMatrix result (this ->m_ iRow, other.m  iCol); 
if (this ->m_iCol ! =other. m_ iRow) 
{ 
return result; 
} 


for(i =0; i<result.m_ iRow; i ++) 
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for (j =0; j«result.m iCol; j ++) 

{ 
for(k=0; k«this-»m iCol; k ++) 
{ 


result [i] [j] = result [i] [j] + (* this) [i] [k] * other{k][j]; 


} 
return result; 
} 
PolynomialMatrix& operator = (const PolynomialMatrix& other) 
{ 
if (&other = =this) 
{ 
return * this; 
} 
int i=0; 
this m, iCol = other. m_ icol; 
this m iRow = other. m_ iRow; 
this ->m_ ppData =new CoefficientArray* [this ->m_ iRow]; 
for(i =0; i<this ->m iRow; i++) 
{ 
this ->m_ppData[i} = new CoefficientArray [this ->m_ iCol]; 
for(int j20; j <this ->m_ iCol; j ++) 
{ 
(this ->m_ ppData[i]) {j] =other[il[j]; 


} 
return * this; 
} 
int GetRowCount () { return m_ iRow;} 
int GetColumnCount () { return m_ iCol;) 
private: 
void ClearMemory () 
{ 
int i=0; 
if (this ->m_ ppData ! =NULL) 
{ 
for(i=0; i<this ->m_ iRow; i +) 
{ 
delete [] (this ->m_ ppData[i]): 
this m ppData [i] =NULL; 
) 
delete []this ->m_ ppData; 
this ->m_ ppData = NULL; 


} 

private: 
CoefficientArray* * m ppData; 
int m, iRow; . 


int m_ icol; 
5 
PolynomialMatrix HGCD(CoefficientArray& a0, CoefficientArrayé& al) 
t 


int m= (int) floor (a0. DEG() / 2.0); 
if (al. DEG() < =m) 
{ 
PolynomialMatrix result (2, 2); 
result [0] [0]. push_ back (1) ; 
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result [1] [1]. push_ back (1); 
return result; 

} 

else 

{ 


CoefficientArray b0; 
CoefficientArray c0; 
for(int i=0; i<m; i++) 
{ 

c0. push_ back (a0 [i]); 
} 
for(int i =m; i< (int)a0.size(); i++) 
{ 

b0. push_ back (a0 [i]): 
} 
CoefficientArray bl; 
CoefficientArray cl; 
for(int i=0; i<m; i++) 


{ 
cl. push_ back (al {i]); 
} 
for(int i =m; i < (int)al. size(); i++) 
{ 
bi. push_ back (al [i]); 
} 


PolynomialMatrix R =HGCD(b0, bl); 
PolynomialMatrix MatrixAOAndA1 (2, 1); 
MatrixAO0AndAl [0] [0] =a0; 
MatrixAOAndAl [1] [0] =al; 
PolynomialMatrix MatrixDAndE =R * MatrixAQAndAl ; 
CoefficientArray d =MatrixDAndE [0] [0]; 
CoefficientArray e -MatrixDAndE [1] [0]; 
CoefficientArray f =d $% e; 
int mDivideTwo =m / 2; 
CoefficientArray g0; 
CoefficientArray h0; 
for(inti-0; i«mDivideTwo; i ++) 
{ 

h0. push_ back(e[i]); 


for(int i=mDivideTwo; i< (int)e size(); i++) 
{ 
g0. push_ back (e[i]); 
} 
CoefficientArray gl; 
CoefficientArray hl; 
for(int i =0; i«mDivideTwo; i ++) 


{ 
hl. push_ back (f [i]); 
} 
for(inti-mDivideTwo; i < (int)f. size(); i+) 
{ 
gl. push_ back (£[i]); 
H 


PolynomialMatrix S - HGCD(g0, gl); 
CoefficientArray q=d / e; 
PolynomialMatrix M(2, 2); 

M[0] [1]. push_ back (1); 
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} 


CoefficientArray GCD(CoefficientArray& a0, CoefficientArray& al) 


{ 


} 


M[1] [0]. push_, back (1); 


for(int i=0; i< (int)q@ size(); i++) 


{ 

qali] = -qlil; 
} 
M[1} [1] =q; 
returnS * M* R; 


if (a0. CanDivideBy (a1) ) 
{ 


return al; 


PolynomialMatrix R =HGCD(a0, al); 
PolynomialMatrix a(2, 1); 

a[0] (0] «a0; 

a[1][0] =al; 


PolynomialMatrix b(2, 1); 
b=R* a; 

CoefficientArray b0 =b[0] [0]; 
CoefficientArray bl =b[1] [0]; 
if (b0. CanDivideBy (b1)) 


( 
return bl; 

) 

eise 

{ 
CoefficientArray c=b0 $ bl; 
return GCD (b1, c); 

} 


void TestGCD() 


{ 


} 


CoefficientArray pl; 
pl. push_ back(1); 
pl. push_ back(1); 
pl. push_ back(1); 
pl. push_ back(1); 
pl. push, back(1); 
pl. Push_ back (1); 
CoefficientArray p2; 
p2. push_ back( -7); 
p2. push_ back( -1); 
p2. push. back (3) ; 
p2. Push_ back( -2); 
p2. push_ back (1) ; 


CoefficientArray result =GCD(pl, p2); 


Cout «« "result:" «« result «« endl; 


int main() 


{ 


TestGCD(); 
system ("pause"); 
return 0; 
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A.37 NDFA 的 模拟 


#include < iostream > 

#include < vector > 

#include < set > 

#include « queue > 

#include «string > 

using namespace std; 

// SimulationOfNDFA 

// ”功能 : NDFA 的 模拟 

// 函数 ; void SimulationOfNDFA (set «int >& S, vector «char » & I, StateTransition& transi- 
tion, int s0, int F, string& x, vector <set «int» >& SSequence) 


// MA: 

HH set < int »& S: NDFA M 的 所 有 状态 

// vector «char >& I: NDFA M 的 字母 表 

// StateTransition& transition: NDFA M 的 转换 函数 
7 int 80: NDFA M 的 初始 状态 

/7 int F: ”NDFA M 的 结束 状态 

// H: 

// vector <set <int > >& SSequence: 状态 转换 的 序列 
/1/ ”测试 函数 ; TestSimulationOfNDFA () 

// 使 用 图 9. 6 中 的 例子 ab* «c 

// 输入 : 

// S: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] 

// I: fa, b, c] 

// transition:... 

// s0: 1 

// F: 10 

// WH: 

// SSequence: ([1, 2, 8], (3, 4, 5, 7, 10], [5, 6, 7, 10]) 
// 


// MXRR NEDA 的 转换 函数 ， 
// IERI! NO “表示 空 输入 
// 
class StateTransition 
{ 
private: 
class StateTransitionItem 
{ 
public: 
set «int > states; 
int state; 
char charater; 
} 


private: 
vector «StateTransitionitem* -» items; 
public: 
StateTransition() 
( 
) 
-StateTransition() 
{ 
for(int i=0; i< (int)this ->items. size(); i++) 
{ 
delete this -> items [i]; 
} 
} 
public: 


void AddToTransition(int state, char charater, set < int >states) 
{ 





FEHCE HRE 399 





for(int i =0; i< (int)this -> items. size(); i++) 
{ 
StateTransitionItem* pItem = this ->items[i]; 
if (pItem -> state = = state && pItem -> charater = -charater) 
{ 
pItem -> states = states; 
return; 


) 
StateTransitionItem* pItem-new StateTransitionItem(); 
pItem -> states = states; 
pItem -> state = state; 
pItem -> charater = charater; 
this -> items. push_ back (pItem) ; 
} 
set «int >operator() (int state, char charater) 
{ 
set < int >empty; 
for(int i =0; i< (int)this -> items. size(}; i++) 
{ 
StateTransitionItem* pItem=this -»items[i]; 
if (pItem -> state = =state && pItem — charater = =charater) 
{ 
return pItem -> states; 


} 
return empty; 


}; 

void SimulationOfNDFA (set <int >& S, vector < char >& I, StateTransition& transition, int s0, 
int F, string& x, vector <set «int» >& SSequence) 
{ 





if (x size() = =0) 
{ 

return; 
} 


set < int >:: iterator setIterator; 
SSequence. resize (x size() +1); 


for(int i=0; i< -(int)x size(); i++) 


{ 


if(is =0) 
{ 
SSequence [0]. insert (s0); 


} 
else 
{ 
for (setIterator = SSequence [i -1]. begin(); 
setIterator ! =SSequence[i-1]. end(); 
setIterator ++) 
{ 
set <int >states =transition(* setIterator, x[i-1]); 
for(set < int > :: iterator it -states. begin(); it ! =states. end(); it ++) 
{ 
SSequence [i]. insert (* it); 
} 
} 
} 


© vector «bool > consideredVec; 
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consideredVec. resize (S size() +1); 


for (setIterator = SSequence [i]. begin(); setIterator ! =SSequence[i ]. end(); setIter- 
ator ++) 


consideredVec[* setIterator] -true; 


queue « int » QUEUE; 
for(set«int»:: iterator it - SSequence[i].begin(); it ! -SSequence[i]. end(); it ++) 
{ 

QUEUE. push(* it); 





} 
while (QUEUE. empty () = = false) 
{ 
int t =QUEUE front (); 
QUEUE. pop (); 
set <int >states =transition(t, ^N0^); 
for (set <int > :: iterator it =states. begin(); it ! =states. end(); it ++) 
{ 
if (consideredvec[* it] = = false) 
{ 
consideredVec[* it] -true; 
QUEUE. push (* it); | 
SSequence[i). insert (* it); 
) 
) 
} 


} 
void TestSimulationOfNDFA() 
{ 
set <int >S; 
S. insert (1); | 
S. insert (2); 
S. insert (3); 
S. insert (4); 
S. insert (5); 
S. insert (6); 
S. insert (7); 
S. insert (8); 
S. insert (9); 
S. insert (10) ; 
vector «char >I; 
I. push_ back( /a^); 
I. push_ back( /b^); 
I. push_ back(’c’); 
StateTransition transition; 
set «int »empty; 
set «int »nextStates; 
transition. AddToTransition(1, ‘a’, empty); 
transition AddToTransition(1, 'b', empty); 
transition. AddToTransition(1, ‘c’, empty); 
nextStates. clear(); 
nextStates. insert (2); 
nextStates. insert (8); 
transition. AddToTransition(1, ^X0^, nextStates); 
nextStates. clear(); 
nextStates. insert (3); 
transition. AddToTransition(2, ‘a’, nextStates); 
transition. AddToTransition(2, 'b', empty); 
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transition AddToTransition(2, ‘c’, empty); 
transition AddToTransition(2, 'N0', empty); 
transition AddToTransition(3, ‘a’, empty); 
transition. AddToTransition(3, 'b', empty); 
transition AddToTransition(3, ‘c’, empty); 
nextStates. clear(); 
nextStates. insert (4) ; 
transition AddToTransition(3, “\0’, nextStates); 
transition AddToTransition(4, ‘a’, empty); 
transition. AddToTransition(4, 'b', empty); 
transition AddToTransition(4, ‘ec’, empty); 
nextStates. clear (); 
next States. insert (5); 
next States. insert (7); 
transition AddToTransition(4, “\0’, nextStates); 
transition AddToTransition(5, ’a’, empty); 
nextStates. clear (); 
nextStates. insert (6); 
transition. AddToTransition(5, “b’, nextStates ); 
transition AddToTransition(5, ’c’, empty); 
transition AddToTransition(5, 'N0', empty); 
transition. AddToTransition(6, 'a', empty); 
transition. AddToTransition(6, 'b'/, empty); 
transition AddToTransition(6, 'c', empty); 
nextStates. clear(); 
nextStates. insert (5); 
nextStates. insert (7); 
transition. AddToTransition(6, “\0°, nextStates); 
transition. AddToTransition(7, 'a', empty); 
transition. AddToTransition(7, 'b', empty); 
transition. AddToTransition(7, 'c', empty); 
next States. clear (); 
nextStates. insert (10); 
transition AddToTransition(7, “\0’, nextStates); 
transition. AddToTransition(8, ‘a’, empty); 
transition AddToTransition(8, 'b', empty); 
nextStates. clear(); 
nextStates. insert (9) ; 
transition AddToTransition(8, ‘c’, nextStates); 
transition AddToTransition(8, “\0’, empty); 
transition AddToTransition(9, ‘a’, empty); 
transition. AddToTransition(9, 'b', empty); 
transition AddToTransition(9, °c’, empty); 
nextStates. clear (); 
next States. insert (10); 
transition. AddToTransition(9, “\0’, nextStates); 
transition AddToTransition(10, ‘a’, empty); 
transition AddToTransition(10, 'b', empty); 
transition. AddToTransition(10, ‘c’, empty); 
transition. AddToTransition(10, “\0’, empty); 
int s0 21; 
int F -10; 
string x = "ab"; 
vector <set <int > >  SSequence; 
SimulationOfNDFA(S, I, transition, s0, F, x, SSequence) ; 
for (vector «set «int» »:: iterator vecit = SSequence. begin(); 
vecit ! -SSequence. end() ; vecit ++) 


cout << "["; 
for (set <int >:: iterator setit =vecit -»begin(); 
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setit ! -vecit -»end(); 
setit ++) 


cout << * Betit <<" Vt"; 
} 
cout << "] " << endil; 


} 
} 
int main() 
{ 
TestSimulationOfNDFA(); 
system("pause"); 
return 0; 


} 


A.38 计算 失败 函数 的 算法 


#include < iostream > 

#include < string > 

#include < vector > 

using namespace std; 

// FAILURE 

// Hk: 求 一 个 模式 申 的 失败 函数 

// Mik: void FAILURE(string& patternB, vector «int »& f) 


Mf 输入 : 
// string& patternB: 模式 申 B 
// 输出 : 
Vf vector«int»&f:  B 的 失败 函数 
// ”测试 函数 : TestFAILURE() 
// 输入 : 
// patternB : " aabbaab"; 
// Math: 
// f: (0, 1, 0, 0, 1, 2, 3] 
ff 
// 
// ”数组 的 第 一 个 元 素 没 有 使 用 
// 
void FAILURE (const string& patternB, vector «int >& f) 
{ 

if (patternB size() = =0) 

{ 

return; 
} 
f. clear (); 


f. resize (patternB size()):; 


£[1] 20; 
for(int j =2; j < (int)patternB size(); j ++) 
{ 
int isf(j-1); 
while(patternB[{j] ! =patternB[i+1] && i>0) 
{ 
i=f[i]; 
} 
if(patternB{j] ! =patternB[i +1] && i= -0) 
{ 
£(3] «0; 
) 
else 
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fljlzis1; 


) 
void TestFAILURE() 
( 
string pattern =" aabbaab"; 
vector «int >f; 
FAILURE (pattern, f); 
for (vector <int >:: iterator it =f. begin(); 
it! =f.end(); 
it ++) 


cout << * it << endl; 


} 


int main() 

{ 
Test FAILURE (); 
System("pause"); 
return 0; 


) 


A.39 判断 一 个 输入 串 是 否 与 模式 匹配 的 算法 


#include < iostream > 

#include < vector > 

#include < set > 

#include < queue > 

#include «string» 

#include < map > 

using namespace std; 

// SimulationOf2DPDA 

// HA: RH22, ANBAR BBA 

// PR: bool SimulationOf2DPDA (vector «Configuration* »& configurations) 


// 8^: 

// (vector «Configuration* »& configurations: 由 输入 串 和 2DPDA 构成 的 所 有 配置 
// 输出 : 

// bool: “输入 趾 符合 模式 则 返回 true， 否 则 返回 false 

// ”测试 函数 : Test FAILURE () 

// 53^: 

// 图 9.17 代表 的 配置 

// 输出; 

// true 

// 8d 

// 为 了 简化 程序 ， 这 里 省 略 了 自动 机 和 输入 串 生成 所 有 配置 的 过 程 。 


typedef struct Configuration 
{ 
string strConfigName; 
int iNumberOfMove; 
}Configuration; 
typedef map <Configuration* , Configuration* > TERM; 
typedef map <Configuration* , set <Configuration* > > PRED; 
typedef set «pair «Configuration* , Configuration* > >NEW; 
typedef set <Configuration* >TEMP; 
void UPDATE (Configuration* C, Configuration* D, TERM& Term, PRED& Pred, NEW& New, TEMP& 
Temp) ; 
bool SimulationOf2DPDA (vector «Configuration* >& configurations) 


( 
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TERM Term; 

PRED Pred; 

NEW New; 

TEMP Temp; 

set <Configuration* >empty; 


// 初始 化 


for(int i =0; i< (int)configurations. size(); i++) 


{ 
Configuration* C -configurations[il; 
Term[C] = NULL; 
Pred[C] = empty; 

} 


vector <Configuration* >terminalConfigs; 


// 找到 所 有 的 结束 配置 


for(int i=0; i< (int)configurations. size(); i ++) 
{ 

if(i! =configurations. size() -1) 

{ 


if (configurations [i] -> iNumberOfMove > configurations [i +1] -> iNumberOfMove) 
( 


terminalConfigs. push_ back(configurations[i]); 


} 
else 
{ 


terminalConfigs. push | back(configurations[i]); 


} 
for(int i =0; i< (int)terminalConfigs. size(); i ++) 
{ 
Configuration* C=terminalConfigs [il]; 
Term{C] =C; ` 
New. insert (make pair(C, C)); 
} 
// 找到 所 有 的 在 一 步 内 ，move 数 不 变 的 配置 对 
for (int i =0; i< (int)configurations. size(); i++) 
{ 
if(i! =configurations. size() -1) 
( 
if(configurations[i] -> iNumberOfMove = -configurations[i +1] -> iNumberOfMove) 
{ 
UPDATE (configurations [i], configurations[i+1], Term, Pred, New, Temp); 
} 
} 
} 


while(! New. empty () ) 


{ 
pair <Configuration* , Configuration* »p-* (New. begin()); 
New. erase (New. begin()); 


Configuration* CComma =p. first; 
Configuration* DComma =p. second; 
int icCommaiIndex = -1; 
int iDCommaIndex = -1; 
for(int iz0; i< (int)configurations. size(); i++) 
( 
if(configurations[i] = =CComma) 
( 


iCCommaIndex = i; 
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if (configurations [i} = -DComma) 
{ 


iDCommaIndex =i; 


} 
// 判断 是 否 存在 比 (C，D) 低 的 配置 对 
if( 
icCommaIndex ! =0 
&& iDCommaIndex ! = (configurations. size() -1) 


&& configurations [iCCommaIndex - 1] -» iNumberOfMove « configurations [iCCommaIn- 
dex] -> iNumberOfMove 


&& configurations [iDCommaIndex] -> iNumberOfMove > configurations [iDCommaIndex + 
1] -»iNumberOfMove i 


) 


Configuration* C =configurations {[iCCommaIndex -1]; 
Configuration* D=configurations [iDCommaIndex +1]; 
UPDATE (C, D, Term, Pred, New, Temp); 


} 


return Term[configurations[0]] = »configurations[configurations. size() -1]; 
} 
void UPDATE (Configuration* C, Configuration* D, TERM& Term, PRED& Pred, NEW& New, TEMP& Temp) 
{ 

if (Term[D] = =NULL) 


{ 
set «Configuration* >configSet - Pred[Dj; 
configSet. insert (C) ; 
Pred[D] = configSet; 
) 
else 
( 
Temp. insert (C); 
while (Temp. empty () = = false) 
{ 
Configuration* B=* (Temp. begin()); 
Temp. erase (Temp. begin()); 
Term{B] = Term[D]:; 
New. insert (make_ pair (B, Term[D])); 
set <Configuration* >predB = Pred[B]; 


for (set <Configuration* »:: iterator it =predB begin(); it ! =predB end(); ++ 


it) 


Configuration* A=* it; 
Temp. insert (A); 


} 

void TestSimulat ionOf2DPDA () 

{ 
vector <Configuration* »vecConfigs; 
Configuration c0; 
Configuration c1; 
Configuration c2; 
Configuration c3; 
Configuration c4; 
Configuration c5; 
Configuration c6; 
Configuration c7; 
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i 
Configuration c8; 
Configuration c9; 
Configuration c10; 
Configuration cll; 
c0. iNumberOfMove -1; 
cl. iNumberOfMove -2; 
c2. iNumberOfMove -2; 
c3. iNumberOfMove -3; 
c4. iNumberOfMove -4; 
c5. iNumberOfMove -3; 
c6. iNumberOfMove =3; 
c7. iNumberOfMove =2; 
c8. iNumberOfMove =3; 
c9. iNumberOfMove -3; 
c10. iNumberOfMove -2; 
c11. iNumberOfMove -1; 
c0. strConfigName = "cO"; 
cl. strConfigName = "cl"; 
c2.strConfigName <="c2"; 
C3. strConfigName = "c3"; 
c4. strConfigName = "c4"; 
cS. strConfigName - "c5"; 
c6. strConfigName = *c6"; 
c7. strConfigName = "c7"; 
c8. strConfigName = "c8"; 
c9. strConfigName = "c9"; 
c10. strConfigName = "C10"; 
cil. strConfigName = "cli"; 
vecConfigs. push | back (&c0) ; 
vecConfígs. push | back (&c1) ; 
vecConfigs. push | back (&c2) ; 
vecConfigs. push , back (&c3) ; 
vecConfigs. push, back (&c4); 
vecConfigs. push_ back (&c5) ; 
vecConfigs. push, back (&c6); 
vecConfigs. push,, back (&c7) ; 
vecConfigs. push, back(&c8); 
vecConfigs. push, back (&c9); 
vecConfigs. push, back(&kcl10); 
vecConfigs. push, | back (&c11); 
bool f -SimulationOf2DPDA (vecConfigs); 
cout << "result: "<< (f= - true ? *true" : "false") <<endl; 
) 
int main() 


( 
TestSimulationOf2DPDA(); 
system ("pause"); 
return 0; 
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